主办方1 DataFun 社区,成立于 2017年,是国内专注于大数据与人工智能开发者的垂直社区。本次活动以“大数据·大模型·双核时代”为主题,于 7 月 5 日在北京丽亭华苑酒店开幕,为期两天。
感谢黄老师赠票 🙏
会议 PPT: https://pan.baidu.com/s/1x8WE9VI-RfJgNzdrHqlh_g?pwd=f6u6
感受与感想
对会议的整体感受还不错
- 会议安排得很密很紧,除了第一天上午的主论坛,其余时间段至少有5个并行的分论坛;讲座之间没有休息,只在下午安排了一个10分钟的茶歇。
- 参会指南写得很清楚,需要的信息都在上面,以此为帮助基本上能找到想听的内容,现场服务人力投入可以最小化。
- 可能是成本考虑,硬件条件差强人意。比如金辉3会议室有些小,宏运1的屏幕分辨率有些低。但也还好,不影响吸收知识。
感受1:大数据拥抱大模型
从会议内容可以明显看出,大数据行业在努力拥抱大模型,从业务模式、产品功能等各个方面,用大模型赋能。 在整个 IT 行业下行的环境下,大数据行业算是比较坚挺的了。和一个从业十多年的老同志聊了几句,没有感觉他有什么焦虑。
下面是第一天参会的流水账,可以跳到下一节。
会议的主题叫”大数据·大模型·双核时代”,主论坛紧扣主题。
- talk 1 阿里云智能大数据产品的演进,基本上就是大数据与 AI 一体化的发展路径
- talk 2 让数据涌现智能,DIKW 模型2 大致总结一下就是
数据-(格式化)->信息->(归纳)->知识->(涌现智能)->智慧
下午开始在数据基建重构:新一代数据架构分论坛,听了
- Data到Data+AI,数据平台的演进。云器科技 产品总监 曲宁分享了数据如何与 AI 对接和他的一些产品洞察:新的 AI 计算范式、变与不变等
- 腾讯 TEG 的 段蒙分享了 Velox3 Memory Management,这是一个纯技术向的分享,干货满满
- 第三个是一个纯产品宣讲,转战阵地到“数智驱动AI时代业务创新”分论坛听了一下数据科学家 李奕萱 的 RAG技术应用实践
茶歇后来到“大模型增强用户体验与用户服务”分论坛,竟然没有座位了
- 百度文库大模型算法负责人 杨栋 分享 AI内容创作,包括生成 ppt,文字自动配图、ai 编辑和作家平台。分享了对外服务 cp.baidu.com
- 小红书高级算法工程师 张浩鑫 分享了 大模型在小红书搜索和推荐中的应用
感受2:大数据+大模型赋能 IT 产业
DIKW 模型2 扩展到整个 IT 行业,涵盖了产品、架构、业务运营、运维等各个职能部门。
按业务职能把不同分论坛主题做了归纳,给出了一些已经发布的 ppt 的链接。不感兴趣的可以跳到下一节。
产品视角
- 主论坛的前两个 talk
- 大模型增强用户体验与用户服务
- 大模型重塑个人助理与办公协作
- 大模型驱动搜索与推荐
- 大模型塑造产品研发新范式
架构
- 新一代数据架构
- 多云数据架构
- 刘建刚-全球化视野下的多云数据架构 快手Flink on k8s的迁移与稳定性保障
- 李亚斌-Alluxio在小红书的实践 如何构建多云统一数据层
- 企查查-任何强-全球视野下的多云与混合云构建 多云统一数据架构 Alluxio + JuiceFs
- 肖杰宝-小米-数据多云架构实践 小米的 存/算多云实践
- 其他主题下的架构 talk
- 业务创新论坛 汤祯捷-阿里产品专家-Data+AI一体的产品架构 分享了基于业务全生命周期的分层架构
业务运营
- 量化决策的艺术
- 数智驱动AI时代业务创新
- 大模型驱动运营与营销策略升级
- 洞察业务本质:指标体系设计与应用
运维
- AIOps 落地实践
- 数据治理,企业智能化的命脉
也有一些技术向的分享
- 大模型微调
- RAG 检索实践
- 彭信东-RAG检索实践
- 邢少敏-阿里云-AI搜索RAG应用实践 背景/方案/应用
- 朱杰 Elasticsearch 8 在 RAG 上的应用
- AI Agent 赋能场景革命
- 实时洞察,湖仓之力(大数据)
- 向量数据库
感想:产研一体,产品负责人很重要
在技术创新中,产品和研发是无法分开的。由一些人负责所谓的产品定义,另外一些人负责进度、质量的模式就是地狱。这种模式下的产品经理,不考虑功能点的复杂度,拍个脑袋就逼研发多少天必须做出来;对技术细节一窍不通,质量问题也不干他事,在公司层面带头攻击研发的交付时间或者质量、性能。成事不足,败事有余。
徐晟,阿里云计算平台事业部产品负责人 指出,产品的评价指标:稳定性、(能力)性价比和性能。只会抄竞品功能和催进度的做个产品助理差不多了,不叫产品负责人。
曲宁,云器科技 产品总监 对大数据的理解和 AI 发展趋势都有深刻思考,在变与不变的把握上言之有物。好的产品负责人必须具备这种能力,否则给他一个大厂的研发资源,他也都能给用掉,最后做出一个四不像出来。
本次大会,有很多 talk 都是产品负责人进行的分享。公司一把手一般都是知道产品重要性的,但可能不太会鉴别产品经理的素质,可以多听听这些分享。
议程概览
https://www.bagevent.com/event/8811235
5号
上午4 主论坛共四个 talk,每个 talk 40 分钟,没有中间休息
- 阿里云智能集团研究员 徐晟 《阿里云智能大数据产品的演进》
- ProtonBase 研究员 蒋晓伟 《分布式 Data Warehouse - 让数据涌现智能》
- 中国人民大学 高瓴人工智能学院 赵鑫 《大模型技术的研发》
- 圆桌对话,大模型发展趋势和企业应用策略探讨
第一个 talk,阿里云智能大数据产品的演进,徐晟强调了大数据与 AI 一体化的发展路径,以及阿里云智能大数据产品的演进。 徐晟还分享了一般产品的评价指标:稳定性、(能力)性价比和性能。可以看到这位产品负责人的技术素养很高。
第二个 talk,让数据涌现智能。ProtonBase 研究员 蒋晓伟 以 DIKW 模型为框架,即数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)模型,描述了在当前这个时代,数据如何转化为更有价值的信息、知识,最终形成智慧的框架。
Talk 3,人大高瓴学院的赵鑫分享了数据资源建设等 AI 研究心得以及他在 arXiv 上发布的论文:大型语言模型综述5
圆桌对话由 DataFun 创始人王大川主持,主持人提出一系列的问题,嘉宾依次回答。记录几个感兴趣的问题
- 国内大模型如何追赶 ChatGPT
- 有哪些高价值应用场景,判断标准是什么
- 企业如何接入大模型
- 如何应对大模型人才的短缺的问题 嘉宾有很多共识,比如
- 大模型的发展速度非常快,但下一代模型的开发难度将大幅增加。
- 企业在拥抱大模型时,应根据自身业务场景选择合适的应用策略,聚焦应用落地。
下午按照不同的主题,分成 6 个分论坛
- 数据基建重构:新一代数据架构(架构)
- 量化决策的艺术:AB实验与因果推断
- 定制未来:大模型微调
- 大模型增强用户体验与用户服务
- 智能·高效 :大模型重塑个人助理与办公协作
- 数智驱动AI时代业务创新(阿里云专场)
每个分论坛里又都有 5 个 talk,量大管饱。
6号
全天6都是 5 个主题并行
上午
- 数据治理,企业智能化的命脉
- 大模型驱动运营与营销策略升级(运营)
- 运维新蓝海:AIOps 落地实践
- 大势所趋:大模型驱动搜索与推荐
- 大模型塑造产品研发新范式
下午
- 全球化视野下的多云数据架构(架构)
- 洞察业务本质:指标体系设计与应用(运营)
- 信息挖掘新篇章:RAG 检索实践
- AI Agent 赋能场景革命
- 实时洞察,湖仓之力(大数据)
DataFun 社区简介 付费内容: https://www.datafuntalk.com/search/datafuncon ↩︎
ProtonBase 研究员 蒋晓伟 总结的 DIKW 模型,描述数据如何转化为更有价值的信息、知识,最终形成智慧的框架 ↩︎ ↩︎
Meta 实现的计算引擎底座 ↩︎