文|白 鸽。数 。企业
生成式AI对国际的划落雕琢,在数据上表现得酣畅淋漓。地背的用
跟着AI大模型年代的面大模型到来 ,非结构化数据(图片、数音视频等)比重日益添加。企业IDC数据显现 ,划落2025年非结构化数据现已占有整个已知数据的地背的用90%以上。
为了让AI更好地辨认和了解这些数据,面大模型一场环绕数据的数“向量化”革新正在悄然打开 。
以最重要的企业查找场景为例 ,Data x AI年代企业的划落需求正在发生改动。曩昔 ,地背的用查找只需求做好全文检索、面大模型结构化查找分词等“要害词查找”,但现在的用户需求现已变成了向量查找、语义查找、多模态混合查找等等 ,“猜你要搜”“图片查找”都成了常态 。
举个最简略的比如,之前咱们手机相册找相片,不能用要害词查找 ,就算用户体会最好的苹果手机 ,也最多只能按“人脸辨认”的人物分类。但现在咱们都能够用要害词来寻觅相片 ,本质上,便是图片在数据层面,做到了“向量化” 。
这个看似纤细的改动,却是在数据层面满意掀起一场巨浪的蝴蝶效应。
OceanBase(以下简称OB) CTO杨传辉以为 ,AI对数据库的改动正在呈现在两个方面:
Bring Data to Al :经过数据提高精确度 ,让大模型愈加精确 ,下降推理本钱;
Bring Al to Data :将AI集成到数据库 ,完结SOL+AI混合核算,发生化学反应。
数据不只影响着大模型功用,AI也在让数据库本身完结晋级 。而数据库的AI才干晋级,也加快推进在RAG等场景中的运用落地。
这场双向改动的化学反应,让未来的数据库 ,成为一个一体化的智能数据底座 。
因而 ,本年5月 ,OB正式宣告面向AI年代的到来,要从一体化数据库转型成为“一体化 AI 数据底座”。而这次革新中,OB的云上数据库OB Cloud成为前锋军 。
究竟,云天然便是适配AI,由于AI这种海量非结构化为主的数据,便是需求一个高传输 、低延时的反应,云上的分布式数据库更合适。
一个企业的AI转型,从查找增强开端 。
“不知道怎样用AI,就先用常识库做一个Agent帮手。”。
而做Agent帮手,就离不开离常识库最近的RAG(查找增强) 。所以近两年,RAG成了企业级AI落地开端的当地 。
建立26年的零售科技公司伯俊科技 ,做AI转型时,第一个阶段建立的便是用RAG做的AI东西——AI通识帮手