AI大模型LLM可以帮助企业做什么?
发布时间:2024年06月06日
“ AI大模型为企业带来三大价值:一是提升效率。通过语音交互、图像处理等技术,辅助企业内部运营。二是创造增长。基于用户需求,开发新产品新业务。如广告、电商等。三是赋能决策。分析大量数据,给出洞察和建议,帮助企业决策。AI是新基建和新动能,明确目标用户和业务场景,释放AI的潜力,助力企业转型升级。”
01
—
兴起
最近,一位朋友向我提出了一个问题:AI人工智能(即ChatGPT)究竟能为企业做些什么呢?
这个问题一下子让我陷入了沉思。毕竟,自从ChatGPT,这个大模型LLM的领军模型惊艳亮相以来,我感觉它几乎可以应付一切。仔细回想,发现很多大厂、企业、个人已经开发出各种基于大模型的应用,但仍有许多企业和个人对于AI大模型如何能够助益他们,还感到困惑不解。
以史为鉴,第一次工业革命的推动力是蒸汽机,当蒸汽机逐渐演进为内燃机并开始广泛应用时,第二次工业革命的创新者——电能及其相关设备正处于初创阶段。而在电力设备逐渐演进为微电子技术时,各种燃油引擎仍在不断改进和推广中。
从这个规律来看,尽管大型语言模型(LLM)现在占据了AI领域的中心舞台,吸引了所有人的关注,但这并不意味着在LLM出现之前AI毫无发展。
在大模型出现之前,AI人工智能已经应用在各行各业中。有以决策为特长的老一代机器学习应用,也有以及侧重感知能力的“传统”深度学习应用。
例如,谷歌、百度、网易等大厂的“翻译”网站,已经广泛应用到高铁进出站的“人脸识别”都是深度学习的典型应用。
任何一个技术革新,都会经历一个“三部曲”般的规律——兴起、发展和大规模应用,以及在这个过程中一次次演进式的迭代。
2018 年 Google 的研究团队开创性地提出了预训练语言模型 BERT,该模型在诸多自然语言处理任务中展现了卓越的性能。但它并没有改变每个模型只能解决特定问题的基本模式。
2020 年,OpenAI 在Google 研究团队提出的技术架构Transformer 和多头注意力机制的基础上,推出了 GPT-3 模型,其在文本生成任务上的能力令人印象深刻,并在少数样本(Few-shot)的自然语言处理任务上取得了优秀的成绩。
2022 年 11 月,ChatGPT 的问世展示了大语言模型的强大潜能,并迅速引起了广泛关注。它不仅可以进行日常对话,还能够完成许多复杂的任务:如撰写文章、回答问题等。
与以往的每个领域有一个特定模型解决任务不同,所有这些任务都由一个模型完成。在许多任务上,ChatGPT 的性能甚至超过了针对单一任务进行训练的有监督算法。
大规模语言模型(Large Language Models,LLM)是一种令人惊叹的技术,它由深度神经网络构建而成,拥有数百亿以上的参数。这些模型采用了自监督学习方法,通过大量无标注文本进行训练。
自2018年以来,诸如Google、OpenAI、Meta、百度和华为等公司以及研究机构相继发布了一系列LLM,其中包括BERT、GPT等,这些模型在几乎所有自然语言处理任务中都表现卓越。
2019年,大模型经历了爆炸式的增长,尤其是在2022年11月,ChatGPT(Chat
Generative Pre-trained Transformer)的发布引发了全球广泛的热议。这一模型使用户能够通过自然语言与系统进行互动,实现了各种任务,包括问答、分类、摘要、翻译和聊天等。大型语言模型展示了对世界知识的强大掌握能力,以及对语言的深刻理解。这正是为什么大模型如此引人注目,引起了全世界范围内的兴趣和探讨。
02
—
发展
人工智能就是一个新的、不断进化的基础设施,可以让你以更好的方式解决新类别的问题或解决旧类别的问题。
它是一种通用技术,意味着它不仅对一件事有用,而是对许多不同的应用有用。它不是一件事,而是很多事情。它是新时代的“电”,可以应用在各行各业。
出现这样一种新的智能系统之后,未来大家都能很便利地、低成本地地获得智力,就像电力革命一样。
“所有产品都值得用AI重做一遍。”
“AI大模型的出现是一个划时代的里程碑,人类将进入到一个全新的智能化时代,就像工业革命一样,大模型将会被各行各业广泛应用,带来生产力的巨大提升,并深刻改变我们的生活方式。”
——阿里张勇
在思考AI可以为企业做什么的时候,我们来看一看,大模型 ChatGPT 出现后,都出现了哪些新产品,以及哪些原有的产品有了大模型的加持。
新产品
下面两张产品榜单图来自过往发布的两份AI产品榜单:
8月国内前10:
8月出海产品前10:
《AI 产品榜·国内 100 强和出海 20 强(2023年08月)》
上面这份榜单上图像视频类人工智能生成的产品,在国内和出海的榜单上占据了绝大多数:占据国内前10中5个名额,出海10个中7个。
根据6月份LikeWeb流量的产品排行榜:
《国外报告90%的AI类产品公司已经实现盈利,而国内大模型和AIGC的访谈说太卷了》
第2名 character,角色扮演AI,按照你的想法,根据电影、小说、游戏、或者你现实生活中身边的人为原型创建一个虚拟的角色,然后开始跟它聊天。
第4名Poe,国外版知乎Quora推出的AI客户端,最早集成了几家LLM(ChatGPT、Bard、Claude)聊天对话在一个界面上。
第6名 PhotoRoom,增加了AI功能的移除图片背景等图片编辑类产品。
第8名 Midjourney 和 36名 Stable diffusion 都是图像生成AI。而第7名 civitai ,也是有名的C站,存放和分享SD开源模型的平台。
第9名 Hugging
Face,一个NLP模型、工具和平台。一个大模型版本的云计算平台,使得开发者用大模型发布应用更简单。
第20名 theb.ai,GPT客户端。
第28名 ChatPDF ,帮助用户快速了解和总结一份PDF文档,基于ChatGPT的工具类产品。
后面国外根据LikeWeb流量榜单的产品类型则丰富得多。说明在国内,大型模型的应用仍处于初级阶段,主要产品集中在聊天机器人和图像视频生成领域。而在国外,这些应用已经迅速落地,进入了许多细分领域。
大模型加持
最早将大模型应用到自家产品的是微软(ChatGPT 背后的投资者),将ChatGPT 应用在 Bing 搜索引擎之中。
随后谷歌将大模型引入了自家的互联网广告,广告收入占谷歌总收入的77%,作为先进生产力代表的AI大模型,其率先在广告业务开花结果。
谷歌将大模型渗透到了广告业务的方方面面:
1.对话式AI中插入广告。Bard是谷歌的大模型C端产品,在对话中插入了与对话相关的产品广告,即将大模型产品本身作为广告流量的来源。
核心原因在于对话式AI产品中的广告业务天然可以形成数据飞轮:AI可以根据用户用自然语言的输入来匹配更准确的广告,用户就能得到更好的商业解决方案(即广告),如此往复,不断滚雪球。
2.实时的广告词生成。使用大模型的内容生成能力,针对用户的搜索关键词针对性地实时生成广告文案,每个用户看到的是实时生成的个性化广告。
和今天业界已有的个性化广告不同,它的广告创意不再是广告主现成的有限集合,而是真正对每个用户需求实时一对一生成的。
3.广告落地页的再创造。广告主只需要填写广告落地页的地址,大模型就可以瞬间读取网页内容,并根据网页内容生成不同的广告创意供广告主投放。
4.商品图片生成。电商用户只需要上传一张简单的商品图片,谷歌的AI算法可以根据不同场景生成不同角度、不同背景和不同规格的多张产品图,还可以将原本相对模糊的图片清晰化。
同样将大模型的能力直接集成到自家产品的,还有微软的 Office 家族,国内金山公司的WPS Office 家族(覆盖了文档分析、大纲写作、PPT制作、翻译等各类办公需求),阿里的钉钉,百度的百度文档,字节跳动的剪映(字节也推出了自己的聊天机器人:豆包)等等。
百度文档的AI助理功能
这些产品有了大模型的助力后,增强了原有功能,提供给用户更多的选择,丰富了用户使用体验,增强了用户的粘性。
除了这类在自家产品增加智能助手的企业做法,很多国内头部的内容网站也都上线了AI助手的功能。
内容平台拥抱的是AI的创作能力,目的是激发站内内容生产活力,填充内容池。
中长视频为主的B站推出了“AI视频小助理”“AI课代表呀”等AI账号试水,用户只要在评论区@AI视频小助理、有趣的程序员这类AI工具账号,并下达“总结”、“高能空降”等指令,AI账号就可以根据时间轴,逐条梳理出视频核心要点。
虎扑则推出了AI伴侣,目的还原球星的个性与风格,与用户互动,更可以自由设置AI机器人的长相、性格、声音。
快手在9月15日开启内测的AI文生图功能“AI玩评”,用户输入指令就可以在评论区快速生成梗图。另一款创作工具“快影”,则是基于AI算法将用户照片一键转化为油画风、水彩风、动漫风等多种风格化效果图片。
抖音推出的“AI绘画”滤镜特效,以裂变传播的短视频拓宽了用户对AI绘画的认知。
AI的兴起,使得内容平台可以探索一个个全新的留存用户工具。
电商平台则采用了AI对话的形式来帮助用户更快的找到合适的商品。
淘宝问问链入了阿里云“通义千问”大模型,推出了“资深导购员”“生活小能手”“美食达人”“旅行策划人”“灵魂写手”五个功能,这五个功能对应的就是用户消费生活的多个场景。在淘宝站内,这些功能也直接和消费链路直接绑定在一起。
百度电商的AI导流入口也隐藏在百度的搜索框中,用户只要在百度搜索商品,AI算法便将站内创作者的相关测评、种草内容以及商品链接全部汇总至百度页面上。
一站式旅行平台携程也将AI技术与旅行这一场景进行融合,基于携程在出行场景的数据沉淀,打造了深耕旅行场景的AI应用——携程问道。
人工智能大佬吴恩达分享过几个AI应用的场景:
给定船舶正在采取或考虑采取的航线,我们可以标记它将消耗多少燃料,并利用这一点使船舶更加节能。
在工厂的自动视觉检测方面:拍一张刚刚制造的智能手机的照片,并标记是否有划痕或其他缺陷。
建立一个餐厅评论声誉监测系统,查看在线餐厅评论,并将其标记为积极或消极情感,用来帮助餐厅改善服务。
对于自动驾驶汽车,给定汽车的传感器读数,标记其他车辆的位置。
作为国内顶级大厂,华为的发力方向是做垂直类的大模型。
华为盘古大模型,根据公开的信息报道,已在金融、金融、制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值:
1.煤矿领域:在全国8个矿井规模使用,覆盖煤矿的采、掘、机、运、通、洗选等业务流程的1000多个细分场景,提升了煤矿工人的工作条件,同时减少了安全事故。
2.铁路领域:高效地识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%。减轻了货运列检员的工作负担,提高了检测效率。
3.气象领域:首个能够超越传统数值预报方法的AI预测模型,提高了预测精度和速度。预测一个台风未来10天的路径,基于预训练的盘古气象大模型,只需单台服务器上单卡配置,10秒内就可以获得比原来3000台服务器的高性能计算机集群上花费5小时仿真更精确的预测结果。
4.金融领域:为银行提供了智能助手,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。
5.制造领域:1分钟即可做出未来3天的生产计划,过去则要花费3个小时以上才能做齐1天的生产计划。
6.药物研发领域:协助研究团队发现新药靶点,将先导药物研发周期缩短至1个月、研发成本降低70%。
还有更多的行业和企业,也在探索跟大模型结合的业务场景。
03
—
思考
曾经和农业方面的朋友交流过,如何利用大模型在数据分析和决策方面的支持和技术上的优势,帮助农业智能化应用:
土壤分析和施肥建议:处理已有土地数据。例如:土壤质地、pH值、水分含量等,以生成施肥建议。模型可以考虑不同植物品种的需求,推荐最优化的施肥方案,以提高产量和减少资源浪费。
农业病虫害识别:帮助识别土壤和作物上的病虫害,通过图像识别或描述性信息,以及提供相关的治疗建议。有助于减少农作物损失和农药的不必要使用。
气象数据分析:根据各地区的历史天气数据,处理气象资料,提供农业生产的天气预测和建议。有助于农民更好地计划种植季节和农业活动。
作物管理和优化:基于历史数据和当前情况,提供作物生长和管理的建议。可能包括且不限于种植时间、间距、灌溉频率和采收时间等方面的建议。
市场分析和销售建议:可以分析市场趋势和需求,帮助做出更明智的销售决策,以获取更好的价格和市场份额。农作物一般以年为单位种植和收获,更好的决策后,可以一定程度上避免种植的风险。
农业教育和培训:用于培训新农民或提供有关最佳农业实践的信息,以提高农业生产效率和可持续性。
开发人员通常是新技术的早期采用者。对 2023 年 5 月、6 月的 ChatGPT 提示进行分析发现,30% 的 ChatGPT 提示与编程相关。其次,最大的大模型接受过包含大量代码的数据集(例如互联网)的训练,这使得大模型特别擅长响应与编程相关的查询。
从技术角度来说,目前还只是大模型时代的初级阶段。现在是用大数据训练模型把推理能力训练出来了,后续我们需要更多可落地的产品,应用在各个方面的生活工作场景。
今天的大模型还有巨大提升空间,并且还在不断提升,例如多模态;同时另一方面大模型的本身的表现却还不能保持足够稳定,例如幻觉,这个时候理解技术的边界,合理的设定目标和要解决的问题,是很有必要的。
如何在大模型还在发展阶段,规划AI产品的开发原则?
以开源模型当 L0 底座,在这之上,做
L1 语言模型、L2 行业模型、L3 场景模型。跟客户通过 AI Agents(代理)来互动得到反馈,模型一点点迭代。将来更好的开源模型出现,在它的基础上再重新训练或继续迭代。
在知道大模型的能力范围,目前的模型和各类AI应用发展情况后,如何考虑AI帮助企业做什么?应该问三个问题,并考虑清楚问题的答案。
用户是谁?他们的问题是什么?能做些什么来帮助他们?确定人工智能是否确实是解决用户问题的有用基础设施。
定义清楚要解决谁的什么问题,定义越清晰,能力越到位,做的东西就能真正「收敛」,真正有商业「穿透力」。
企业的本质在于数据以及流程。
大企业降本增效,小企业引流工具。
小企业并不关心技术和愿景,谁能帮它们解决增长问题,就会因此付钱。
大企业的数据化,智能化,最主要的目的就是要降本增效。但效率优化空间总有尽头,可是增长和发展的空间,却相对无限。企业服务里开源远比节流重要,用户永远愿意为了发展而付费。
企业内部要引入人工智能,获得AI的助力,也可以遵循上面同样的思考原则,要么降本增效,要么获得增长。
人工智能与专业领域的合作往往会带来新的机会,新的方向。知识数据库与基础模型一样至关重要。个人和企业记录并组织他们的数据,包括过程和结果数据,将在人工智能驱动的世界中获得更大的竞争优势。可以利用这些记录的私有数据供算法使用,创造独特的内容,并做出更加高效的决策。
例如,出现了很多搭建企业专有知识库的开源项目,还有和知识图谱结合的探索等等。
《教程|使用免费GPU 资源搭建专属知识库
ChatGLM2-6B + LangChain》
04
—
尾声
在人工智能领域的初创公司,如果目标明确,那么AI项目的实施通常会相对顺利。然而,对于那些原本不涉足AI领域的公司,要想推进AI项目,可能会面临多种实际问题:
认知不足: 在身边,可能缺乏对AI技术的深刻理解,团队中只有少数人或者甚至只有你自己对AI有一些了解。
需求不明确: 公司可能缺乏足够的业务需求和反馈,这使得难以发现适合AI与业务结合的场景。
支持不足: 尽管高层领导有AI的构想,但作为执行者,由于前述原因,可能难以获得更多支持和资源。
在面对这些挑战时,关键是建立一支具备AI知识的团队,积极寻找并明确业务需求,做出必用场景,爆款场景,以及有意推动大家去使用,与管理层进行有效的沟通,以确保AI项目的顺利推进。
这部分则涉及到跨领域问题,比如项目管理和推进策略,这需要专门的讨论,不在此占用篇幅。
出自:https://mp.weixin.qq.com/s/2ssiUJn5WKpgAYJCJVUslA
Magic Eraser是一款图像编辑软件,可以自动识别和删除照片中的背景。它是从普通照片编辑软件中分离出来的一项功能,主要用于快速和准确地去除照片中不需要的背景部分。