DataFunCon 2024 北京站 参会感想

Posted by li3huo on Monday, July 8, 2024

主办方1 DataFun 社区,成立于 2017年,是国内专注于大数据与人工智能开发者的垂直社区。本次活动以“大数据·大模型·双核时代”为主题,于 7 月 5 日在北京丽亭华苑酒店开幕,为期两天。

感谢黄老师赠票 🙏

会议 PPT: https://pan.baidu.com/s/1x8WE9VI-RfJgNzdrHqlh_g?pwd=f6u6

感受与感想

对会议的整体感受还不错

  • 会议安排得很密很紧,除了第一天上午的主论坛,其余时间段至少有5个并行的分论坛;讲座之间没有休息,只在下午安排了一个10分钟的茶歇。
  • 参会指南写得很清楚,需要的信息都在上面,以此为帮助基本上能找到想听的内容,现场服务人力投入可以最小化。
  • 可能是成本考虑,硬件条件差强人意。比如金辉3会议室有些小,宏运1的屏幕分辨率有些低。但也还好,不影响吸收知识。

感受1:大数据拥抱大模型

从会议内容可以明显看出,大数据行业在努力拥抱大模型,从业务模式、产品功能等各个方面,用大模型赋能。 在整个 IT 行业下行的环境下,大数据行业算是比较坚挺的了。和一个从业十多年的老同志聊了几句,没有感觉他有什么焦虑。

下面是第一天参会的流水账,可以跳到下一节。

会议的主题叫”大数据·大模型·双核时代”,主论坛紧扣主题。

  • talk 1 阿里云智能大数据产品的演进,基本上就是大数据与 AI 一体化的发展路径
  • talk 2 让数据涌现智能,DIKW 模型2 大致总结一下就是 数据-(格式化)->信息->(归纳)->知识->(涌现智能)->智慧

下午开始在数据基建重构:新一代数据架构分论坛,听了

  1. Data到Data+AI,数据平台的演进。云器科技 产品总监 曲宁分享了数据如何与 AI 对接和他的一些产品洞察:新的 AI 计算范式、变与不变等
  2. 腾讯 TEG 的 段蒙分享了 Velox3 Memory Management,这是一个纯技术向的分享,干货满满
  3. 第三个是一个纯产品宣讲,转战阵地到“数智驱动AI时代业务创新”分论坛听了一下数据科学家 李奕萱 的 RAG技术应用实践

茶歇后来到“大模型增强用户体验与用户服务”分论坛,竟然没有座位了

  1. 百度文库大模型算法负责人 杨栋 分享 AI内容创作,包括生成 ppt,文字自动配图、ai 编辑和作家平台。分享了对外服务 cp.baidu.com
  2. 小红书高级算法工程师 张浩鑫 分享了 大模型在小红书搜索和推荐中的应用

感受2:大数据+大模型赋能 IT 产业

DIKW 模型2 扩展到整个 IT 行业,涵盖了产品、架构、业务运营、运维等各个职能部门。

按业务职能把不同分论坛主题做了归纳,给出了一些已经发布的 ppt 的链接。不感兴趣的可以跳到下一节。

产品视角

  • 主论坛的前两个 talk
  • 大模型增强用户体验与用户服务
  • 大模型重塑个人助理与办公协作
  • 大模型驱动搜索与推荐
  • 大模型塑造产品研发新范式

架构

业务运营

运维

也有一些技术向的分享

感想:产研一体,产品负责人很重要

在技术创新中,产品和研发是无法分开的。由一些人负责所谓的产品定义,另外一些人负责进度、质量的模式就是地狱。这种模式下的产品经理,不考虑功能点的复杂度,拍个脑袋就逼研发多少天必须做出来;对技术细节一窍不通,质量问题也不干他事,在公司层面带头攻击研发的交付时间或者质量、性能。成事不足,败事有余。

徐晟,阿里云计算平台事业部产品负责人 指出,产品的评价指标:稳定性、(能力)性价比和性能。只会抄竞品功能和催进度的做个产品助理差不多了,不叫产品负责人。

曲宁,云器科技 产品总监 对大数据的理解和 AI 发展趋势都有深刻思考,在变与不变的把握上言之有物。好的产品负责人必须具备这种能力,否则给他一个大厂的研发资源,他也都能给用掉,最后做出一个四不像出来。

本次大会,有很多 talk 都是产品负责人进行的分享。公司一把手一般都是知道产品重要性的,但可能不太会鉴别产品经理的素质,可以多听听这些分享。

议程概览

https://www.bagevent.com/event/8811235

5号

上午4 主论坛共四个 talk,每个 talk 40 分钟,没有中间休息

  1. 阿里云智能集团研究员 徐晟 《阿里云智能大数据产品的演进》
  2. ProtonBase 研究员 蒋晓伟 《分布式 Data Warehouse - 让数据涌现智能》
  3. 中国人民大学 高瓴人工智能学院 赵鑫 《大模型技术的研发》
  4. 圆桌对话,大模型发展趋势和企业应用策略探讨

第一个 talk,阿里云智能大数据产品的演进,徐晟强调了大数据与 AI 一体化的发展路径,以及阿里云智能大数据产品的演进。 徐晟还分享了一般产品的评价指标:稳定性、(能力)性价比和性能。可以看到这位产品负责人的技术素养很高。

第二个 talk,让数据涌现智能。ProtonBase 研究员 蒋晓伟 以 DIKW 模型为框架,即数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)模型,描述了在当前这个时代,数据如何转化为更有价值的信息、知识,最终形成智慧的框架。

Talk 3,人大高瓴学院的赵鑫分享了数据资源建设等 AI 研究心得以及他在 arXiv 上发布的论文:大型语言模型综述5

圆桌对话由 DataFun 创始人王大川主持,主持人提出一系列的问题,嘉宾依次回答。记录几个感兴趣的问题

  1. 国内大模型如何追赶 ChatGPT
  2. 有哪些高价值应用场景,判断标准是什么
  3. 企业如何接入大模型
  4. 如何应对大模型人才的短缺的问题 嘉宾有很多共识,比如
  5. 大模型的发展速度非常快,但下一代模型的开发难度将大幅增加。
  6. 企业在拥抱大模型时,应根据自身业务场景选择合适的应用策略,聚焦应用落地。

下午按照不同的主题,分成 6 个分论坛

  1. 数据基建重构:新一代数据架构(架构)
  2. 量化决策的艺术:AB实验与因果推断
  3. 定制未来:大模型微调
  4. 大模型增强用户体验与用户服务
  5. 智能·高效 :大模型重塑个人助理与办公协作
  6. 数智驱动AI时代业务创新(阿里云专场)

每个分论坛里又都有 5 个 talk,量大管饱。

6号

全天6都是 5 个主题并行

上午

  1. 数据治理,企业智能化的命脉
  2. 大模型驱动运营与营销策略升级(运营)
  3. 运维新蓝海:AIOps 落地实践
  4. 大势所趋:大模型驱动搜索与推荐
  5. 大模型塑造产品研发新范式

下午

  1. 全球化视野下的多云数据架构(架构)
  2. 洞察业务本质:指标体系设计与应用(运营)
  3. 信息挖掘新篇章:RAG 检索实践
  4. AI Agent 赋能场景革命
  5. 实时洞察,湖仓之力(大数据)

  1. DataFun 社区简介 付费内容: https://www.datafuntalk.com/search/datafuncon ↩︎

  2. ProtonBase 研究员 蒋晓伟 总结的 DIKW 模型,描述数据如何转化为更有价值的信息、知识,最终形成智慧的框架 ↩︎ ↩︎

  3. Meta 实现的计算引擎底座 ↩︎

  4. DataFunCon 2024·北京站首日 ↩︎

  5. https://github.com/RUCAIBox/LLMSurvey ↩︎

  6. DataFunCon 2024·北京站第二天 ↩︎