清华大学联合腾讯云攻坚数据库AI研究:让数据库听懂自然语言

发布时间:2025-11-22 13:10

DeepSeek爆火背后,底层数字技术也在求索与AI的深度结合。

3月7日,清华大学、腾讯云、intel在北京宣布启动“数据库AI联合创新计划”,围绕数据库与大模型的交叉技术展开深度研究,推动数据库智能化升级,同时为AI应用构建高效数据基础设施。

这也是国内首个数据库AI领域的产学研联动项目。


(图:清华大学、腾讯云、intel联合启动“数据库AI联合创新计划”)

随着大语言模型技术爆发,数据库系统面临从“被动存储”向“主动服务”转型的挑战。传统数据库依赖人工编写复杂查询语句,而大模型的自然语言交互能力可大幅降低使用门槛;另一方面,AI训练与推理所需的海量数据处理,也亟需数据库在分布式架构、缓存管理等环节实现性能跃升。

针对这一趋势,本次合作规划了两大技术攻坚路径:一方面研发基于大模型的智能查询生成与优化系统(Text2SQL),让用户通过自然语言直接操作数据库,实现艰深的数据库技术也能听懂“人话”;另一方面打造面向大模型推理的分布式缓存产品,解决AI任务调度、存储资源分配等核心难题。

在Text2SQL方向,项目组提出端到端技术框架,重点突破语义理解、模式匹配、SQL验证等关键环节。通过大模型微调、强化学习(DPO)与检索增强(RAG)技术,系统可将用户提问拆解为多级子任务,并动态匹配数据库表结构,最终生成高准确率SQL语句。

面向大模型推理加速,项目组设计了分布式缓存系统,通过两阶段任务调度、KVCache优化及GPU直连存储技术,显著降低计算资源浪费。

作为合作的重要支撑,腾讯云在数据库AI领域已有不少积淀。据腾讯云数据库副总经理罗云透露,腾讯云数据库以AI for DB和DB for AI作为技术发展的战略方向,在多产品中已集成自适应运维与故障诊断、数据库智能优化、自然语言驱动数据分析等能力,同时依托腾讯云向量数据库千亿级向量规模和500万QPS峰值能力,为3000多家企业构建了AI时代的数据枢纽。

此次合作也凸显了“产学研”深度融合的创新模式。清华大学数据库科研组在学术领域连续多年位列CSRankings全球第一,腾讯云则拥有业界领先的工程落地能力。双方合作将加速技术研究从实验室到企业生产环境的进度。

清华大学数据库科研组表示:“未来的数据库不仅是存储工具,更是AI产业链的数据大脑。我们期待通过这次合作,为全球数据库技术发展提供中国方案。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

网址:清华大学联合腾讯云攻坚数据库AI研究:让数据库听懂自然语言 https://mxgxt.com/news/view/1888911

相关内容

清华大学联合腾讯云攻坚数据库AI研究:让数据库听懂自然语言
向量数据库=AIGC基石?让子弹飞一会儿
蚂蚁技术研究院院长陈文光:大模型将带来向量数据库和关系数据库的一体化
腾讯数据库RTO
长亮科技荣获腾讯云数据库杰出合作贡献奖
腾讯QQ群数据库泄露:姓名、年龄、从业经历等均可“秒查”
智源研究院联合拓尔思、中科闻歌共建中文互联网语料库,为大模型夯实数据基础
数据库
腾讯音乐数据研究院发布行业重磅白皮书:2021年华语新歌数量首次突破百万
明星数据库指数

随便看看