华东师范大学MEM科创专家公开课回顾
在世界大变局的当下,国家发展亟待科技创新引领,个人发展同样需要战略方向。攻读华东师范大学工程管理硕士MEM专业学位(首席技术官方向、智能创新工程方向、应急技术与管理方向、重大项目管理方向),是一个全新的选择。为让申请MEM项目的考生们更加准确地理解和体验我们学位培养的理念和方向,并准备好提前面试,学院举办华东师范大学MEM科创专家公开课。
3月7日,华东师大MEM科创专家公开课第十三讲成功举办。本次公开课邀请到浩鲸云数字化转型资深专家梅丛银,以“AI产业链数据集和热点产品及企业DT+AI实践”为题进行授课。梅丛银主要围绕AI的整个产业链,包括数据集、大模型AI在企业侧的实施等展开授课内容。
01人工智能简史与技术应用
梅丛银首先介绍了人工智能历史与产业应用。他指出,过去100年,科技进步推动了人类社会的进步,特别是近20年,人工智能的发展对GDP增长产生了巨大影响。未来几十年,人工智能将具有划时代意义,对全球经济具有重要影响。他讲述了人工智能的发展史,生成式AI技术日新月异,大语言模型(LLM)不断发展,一个巨大的神经网络(Transformer)诞生并应用到产业中,大语言模型经历了从算法到算力再到产业的转变。
梅丛银分析了2024 AI热点SORA(索拉)视频生成模型及特点。他认为,索拉作为世界模拟器的视频生成模型,其栩栩如生的模拟技术将对电影、教学、医疗、游戏等行业产生很大影响。梅丛银介绍了索拉团队的技术文档和技术论文以及他们的算法和基本原理,分享了自己对索拉的理解,认为它不仅仅是一个人工智能技术,还需要有艺术的观点。梅丛银强调学习并分享优质产品的重要性,认为一个好的产品需要符合专业,特别是团队的领导者需要有复合视角,这样才能做出更优秀的产品。
梅丛银指出,Sora区别于pika、runway、MJ等视频生成模型。第一,复用LLM训练思路。采用DiT扩散转化器模型,将各种尺寸质量图片/视频进行降维,统一为patch补片,用GPT进行文本字幕训练(类似LLM中的token)。不同于其他视频生成模型使用特定类型、固定尺寸的视觉数据训练,导致生成的视频限制较大。第二,相较于对手产品,速度快。Sora AI视频市场突破60s,远高于Pika、Runway的3-5秒。Sora采用Diffusion+Transformer模型,一次性生成完整时长的视频,并逐步消除噪声。第三,单视频多角度镜头。不同于现有产品智能通过单一视角呈现物体,Sora支持多角度的镜头无缝切换,一致性高。第四,具备物理世界模型特点。Sora可以模拟影响物理世界状态的简单行为。
02技术管理视角下的技术创新
梅丛银表示,要从技术管理的角度考虑技术创新。他指出,CTO、技术总监或研发总监需要从多个维度、内容、技术、数据工程等角度去考虑创新。他分析了谷歌和Open AI在从零到一的创新过程中存在的问题,以及如何进行交叉创新,介绍了了技术管理视角下的算力需求和市场商业化问题。梅丛银介绍了大模型的商业化成本、市场接受度以及人工智能的发展趋势。大模型的定价通常以1K个token为单位,其价格约为55美金。从更宏观的角度来看,AI技术正在重新定义工作,包括预测未来十年的人工智能、区块链、数字货币、人工生物学等。此外,AI技术与机器人、自动驾驶、LRL三等功能相结合,预计未来市值可能达到220万亿。
梅丛银分析了科技与金融的关系,指出科技的发展需要资金的支持,而金融则需要技术的创新。科技与金融相互依存,只有同时发展,才能更好地推动科技创新。他指出,人工智能、电池能源和是未来的两大主要技术,而资本对技术创新的重要性不容忽视。部分企业在芯片领域的价格下降,以及国内芯片产业的发展,相信这些都会推动我国GPU研发和人工智能技术的应用。人工智能对效率提升产生影响。人工智能在过去70年里没有明显变化,但随着ChatGPT的出现,消费者和企业对人工智能的认可度有所提高。AI技术模型正在从基本模型向专业领域渗透,如医疗、法律等。此外,成本降低和性能提升也是AI技术带来的好处。然而,开源和闭源的问题仍然存在,随着市场的发展,开源社区和自由在竞争。未来,随着算力的提升,可能会出现超人类AI,但这也带来了定价权问题。
紧接着,梅丛银讲述了AI技术模型的五大特征。AI技术模型具有五个能力,包括语言、视觉、机器人、推理和人机交互。这些能力在人工智能领域非常重要,特别是对于未来的人机交互影响会非常大。数据集在人工智能研究中非常重要,医疗、法律和社会等三个行业在人工智能研究中具有基础地位。梅丛银介绍了人工智能教育技术模型的构建和应用。教育是社会三大基础行业之一,技术模型在构建过程中需要考虑可扩展性、多模态、适配性、安全和隐私等方面。同时,要关注可解释性、可追溯性和公正性等问题。此外,随着大数据中心的兴起,能源消耗成为了一个重要问题,需要关注环境影响。预计人工智能产业规模将越来越大,未来可以达到万亿级别。
接下来,梅丛银分析了人工智能产业的发展与挑战。简述了人工智能领域的基础设施问题,包括存储计算、云设施、基础模型等。同时,国内外在数据集、数据标注、向量数据库等方面存在差距。目前国内在数据集方面还存在一些问题,如英文占主导地位、中文排名较后等,需要努力提高数据质量。梅丛银对于数据集的选择与应用方面给出建议。他介绍了几个数据集,包括Big Science的Rose语料库等。这些数据集涵盖了各种主题和领域,如知识问答、学术研究等。重点介绍了如何从数据集的角度来考虑方法论和流水线,以及如何组织数据集。首先,可以从公共网站或数据源上爬取数据,然后进行过滤和下载。其次,要关注国内大模型的进展,包括注册数量、流行度等。最后,他强调了在商业角度考虑数据集的重要性,以及如何分配利益和指导验证。
03大模型技术参数与应用
丛银讨论了数据集、技术参数、模型选择和应用趋势。从大模型产业数据集和模型评测如何选型,到分析端到端的时间、成本和技术参数的重要性,以及一些应用趋势,包括将企业行业的特征放入本地数据库,结合通用框架进行集成,以及使用自然语言处理技术等。梅丛银介绍了向量化数据库在各个领域的应用,包括运营商在海外市场的应用。首先,通过向量化数据库,可以满足海外企业和跨境企业的需求。其次,通过RAG和向量数据库,可以建立问答系统,方便企业各部门进行沟通。最后,他重点讨论了数据流水线的实现方法,包括转换、拆解、清洗、召回和阅读。
梅丛银介绍了大模型使用与数据安全问题,以及如何进行专业数据的培养与市场应用。国内企业在使用大模型时遇到禁止数据出企业等问题。为了解决此问题,一些公司采用缓冲池或安全池来过滤数据,但这种方式仍然存在风险。此外,由于技术模型在我国法律上受到保护,导致很多政府行业都是私有化模型。为了提高大模型的准确性和专业性,需要在训练过程中加入验证环节。关于数据集的重要性以及专业数据的来源。梅丛银认为,要成为一个在某领域专业的数据分析师,需要不断学习和实践,特别是要掌握专业的数据集,如中国的刑法、民事法等。同时,还需要时间的积累。
本文转载自微信公众号“华东师范大学MEM”