NEOHOPE大模型发展趋势预测2601

NEOHOPE大模型发展趋势预测2601
1、基础模型比赛已结束,能胜出的就头部这几家,开源模型市场更大
2、技术迭代,会导致基础模型价格进一步降低,其他模型厂商向杀入战局越来越难
3、大模型向垂直领域迁移动作明显:大厂商开始大力推进垂直领域模型
4、各垂直领域头部企业会握紧数据,加大开源大模型的开发应用,各大应用会进一步融入AI能力
5、端云模型应用场景进一步增多,小模型会更加被重视
6、头部大模型应用,逐步进入收费时代,可以盈利逐步成为各大模型团队KPI
7、大模型相关应用进一步爆发,在短视频、非现实文学创作、医疗健康等方面,大模型会进一步发力

一线厂商【主观】:
1、国外闭源:ChatGPT、Claude、Gemini
2、国外开源:Mistral
3、国内闭源:豆包、千问商业版、智谱商业版、月之暗面
4、国内开源:千问、DeepSeek、智谱

其他有机会或有能力入局的厂商:
国外:X、Meta、微软、苹果、亚马逊
国内:腾讯、华为

大模型时代学习方法小结

最近和几个朋友聊天的时候,大家稍微总结了一下大模型时代要如何快速学习,汇总了几个典型的方式:

方法1:在你有一定了解的领域,把AI当做有无限耐心的老师,无限提问法
1、当你想深入了解一个事情的时候,可以用清晰的命令描述好自己的问题,去多个AI同时发送该问题。
2、对每个AI反馈的内容进行初筛,最终保留2~3个候选AI
3、用靠谱的那个AI,去进一步咨询自己想理解的问题
4、不断的拓展问题的广度和深度,在这个过程中,最好记录一个思维导图,对于想进一步理解的点,做好标记
5、用适合自己的学习方式,把这些知识点逐一搞清楚
6、当AI不断说车轱辘话的时候,先更换说书,后尝试备选AI
7、一个不理解、但很重要的知识点,多发给几个AI,让他们交叉验证
8、请AI把整个过程的资料,梳理为笔记或思维导图
其实大家可以看到,知识面比较广的、求知欲强的、能提出好问题的、有一定较真精神的人,在AI时代会有更多的优势

方法2、在你很不了解的领域,把AI当做向导
1、当你想了解一个陌生事情的时候,可以要求AI先对该领域知识做一个思维导图的摘要,去多个AI同时发送该问题
2、对每个AI反馈的内容进行初筛,最终保留2~3个候选AI,此时你对这个领域有了初步的理解
3、对你感兴趣的要点,要求AI对思维导图进行扩展,并多举示例
4、对其中某个细节问题,不清楚的,调整到“方法1”
5、关键点要做好交叉验证
6、请AI把整个过程的资料,梳理为笔记或思维导图
其实大家可以看到,在AI的加持下,很多技术的专业护城河,已经消失了。在一个行业不够纵深的人,会变得难以生存。以后,行业新人很可能会变得更难找好的工作,因为门槛没了,谁都能做。

方法3、一个任务多用几个AI,让他们相互印证补充
先把一个问题描述清楚,约定好输出格式和输出要求,同时发给A、B、C、D四个模型。
先判断哪个模型输出效果最好,比如模型A。
将其他模型B、C、D的输出,给到模型A,要求进行检查及补充。
然后要A,进行检查补充。
然后把A最后的信息,给到第二好的B,再进行检查及补充。
一般来说,此时输出质量就很高了,如果不行就再来一轮。

方法4、日常工作生活中,把AI当做助理或外脑
相信这方面大家都会有很多尝试,从写总结报告到完成PPT,从画Excel表格到写简单代码,从P图到做视频。
在大模型当前技术水平下,大家记住一点就行:AI方便时用AI,人方便时用人,效能优先,不要纠结。

方法5、读代码时,让AI补充注释,然后对重点代码进行详细解释
相信不少同学都在用AI写代码。
但用AI去读代码也是很爽的,包括平时很少用的语言,也是很容易读懂,推荐大家试试。

划重点:快速调整自己,适配AI时代
在AI时代,几乎每个人都要抛弃过去思考、学习和工作的习惯,需要重新训练自己的思维方式,重新调整学习和工作的方法。
只有快速适应这个时代,才能快速越过“AI斩杀线”,去碾压别人,而不是被别人碾压。

目前能看到的趋势有:
1、有业务经验、能驾驭好AI工具的人,最受欢迎
2、没业务经验、能驾驭好AI工具的人,次之
3、有业务经验、不能驾驭好AI工具的人,受到冲击最大
4、没业务有经验、不能驾驭好AI工具的人,在部分行业很难生存
5、有想法、能驾驭好AI工具的人,会爆发
6、没想法的人,会吃亏

大模型为啥能 “记住” 你?揭秘 AI 背后的 “用户记忆逻辑”

根据Manthan Gupta在X上的分享,整理了一下大模型是如何记住你的:
大模型是如何记住你的


大模型为啥能 “记住” 你?揭秘 AI 背后的 “用户记忆逻辑”

有没有发现,现在的大模型越来越懂你?聊过的话题、喜欢的沟通风格、甚至不经意提过的家人信息,它都能精准呼应 —— 这背后不是 AI 有了 “超能力”,而是一套完善的用户记忆体系在发挥作用。今天就拆解大模型的 “记忆逻辑”,看看它到底在悄悄记录哪些信息,又是如何让互动更有 “人情味” 的。

一、基础信息:搭建你的 “用户画像骨架”
大模型的记忆从 “基础信息采集” 开始,这些数据是构建用户画像的核心,也是精准互动的前提:
终端与场景信息:比如你所在的市区、访问日期、使用的系统(Windows/MacOS)、浏览器(Chrome/Safari)、进入对话的入口、设备分辨率等,这些信息能帮 AI 适配不同场景(比如移动端优化回复长度);

账号与活跃度数据:会员级别、账号注册年限、近 7 天 / 30 天的互动频率,能让 AI 判断你是新用户还是核心用户,调整服务优先级(比如会员用户获得更细致的记忆服务);

核心身份标签:你的工作领域、具体工种(比如 “互联网运营”“教师”“工程师”),会直接影响 AI 的回复专业度 —— 给运营聊 “转化率”,给教师聊 “教学设计”,精准匹配行业语境。

二、偏好与习惯:填充 “个性化细节”
如果说基础信息是 “骨架”,那偏好与习惯就是让画像 “活起来” 的关键,也是大模型 “懂你” 的核心体现:
内容与价值观偏好:你感兴趣的话题(比如科技、育儿、职场)、隐含的价值观倾向(比如注重效率、偏爱温和表达),会让 AI 调整内容方向 —— 你喜欢干货,就少些铺垫;你关注育儿,就主动关联相关话题;

沟通风格适配:你的对话节奏(比如简洁短句 vs 详细长文)、常用语气(比如正式 vs 口语化),AI 都会默默记录,慢慢调整回复风格,形成 “专属沟通默契”;

模型使用偏好:比如你习惯用 AI 做文案生成,还是问题解答,或是数据分析,AI 会优先优化你高频使用的功能,让操作更顺手。

三、关系与深度信息:触碰 “情感连接点”
优秀的大模型不仅能提供服务,还能建立情感共鸣,这离不开对 “深度关系信息” 的记忆:
个人生活关联:你聊过的家人情况(比如 “有个上小学的孩子”“父母喜欢旅游”)、身边重要的人和事,AI 会妥善记录,后续对话中自然呼应(比如你说 “想规划假期”,AI 会关联 “父母喜欢旅游” 的信息推荐方案);

话题深度轨迹:通过分析你话题的深度、平均消息长度、对话持续时间,AI 能判断你是 “浅尝辄止” 还是 “深入探讨” 型用户 —— 对前者提供简洁结论,对后者补充细节和延伸内容,贴合你的沟通需求。

四、对话内容:精准复刻 “互动轨迹”
除了静态信息,大模型对 “动态对话内容” 的记忆更是核心,主要分两层:
当前对话全记录:对你正在进行的对话内容做 “十分细致” 的存储,包括每一句提问、回应、补充说明,确保上下文连贯 —— 比如你中途提到 “刚才说的方案再调整下”,AI 能精准定位到之前的方案细节,不用你重复说明;

历史对话摘要:对近期 10~20 轮对话做 “十分精简” 的话题摘要,提炼核心信息(比如 “上周聊过短视频脚本创作,用户需要职场类选题”),既节省存储资源,又能快速唤醒历史记忆,避免 “聊过就忘”。

总结:大模型的 “记忆本质”—— 让 AI 从 “工具” 变成 “专属助手”
其实大模型的记忆逻辑很简单:从 “基础信息” 到 “偏好习惯”,再到 “深度关系” 和 “对话轨迹”,层层递进记录与你相关的关键信息,最终实现 “千人千面” 的个性化互动。

它不会无差别存储所有信息,而是 “抓重点”—— 有用的细节记牢,冗余的内容精简,既保证互动的精准度,又兼顾效率。这种记忆不是 “监控”,而是 AI 服务的核心竞争力:当大模型能记住你的需求、适配你的习惯、呼应你的情感,它就不再是冷冰冰的工具,而是能懂你、帮你、陪你成长的 “专属助手”。

你有没有遇到过让你惊艳的 “AI 记忆时刻”?或者你希望大模型记住哪些信息、忽略哪些内容?欢迎在评论区留言交流~

大模型时代,人类的核心竞争力:7 种不可替代的 “碳基生物能力”

Featured

咨询了一下各大模型,大模型时代碳基生物核心能力:
大模型时代碳基生物核心能力


大模型时代,人类的核心竞争力:7 种不可替代的 “碳基生物能力”

当 AI 能写文案、做分析、解难题,甚至替代部分重复性工作时,很多人开始焦虑:“人类的价值在哪里?” 其实答案很明确 —— 大模型能高效处理 “标准化任务”,但人类独有的 “情感温度、创造性思维、复杂决策力” 等核心能力,才是不可替代的立身之本。今天就拆解大模型时代,人类最该深耕的 7 种 “碳基生物核心能力”,帮你找准竞争力锚点。

一、人性温度与情感智慧:AI 无法复制的 “情感连接力”
机器能识别情绪,但永远无法真正 “共情”;能输出安慰的话术,却没有发自内心的人文关怀 —— 这正是人类的核心优势:
深度共情与理解:能站在他人角度思考问题,读懂语言背后的情绪、委屈与期待,比如医患沟通中安抚患者焦虑,心理咨询中感知隐性需求;

情感调节与关系构建:不仅能识别情绪,还能调节氛围、化解人际冲突,建立信任与亲密关系,比如团队管理中的激励引导、跨部门协作中的矛盾调解;

文化敏感与价值传递:理解不同文化背景的差异,兼顾人文关怀与价值观引导,比如教育中塑造孩子的正向品格,跨文化沟通中避免误解。

这种 “有温度的连接”,是 AI 再精准的算法也无法复刻的,也是人际关系、客户服务、教育医疗等领域的核心需求。

二、复杂决策与伦理判断:不确定性中的 “价值锚点”
大模型能提供数据支持和方案选项,但面对模糊地带、多方利益冲突时,最终的决策力仍属于人类:
模糊问题处理与决断:在信息不全、环境不确定的情况下,能权衡多变量利弊,做出合理决断,比如商业运营中应对突发市场变化,危机事件中的快速响应;

伦理权衡与价值校准:在道德困境中坚守底线,纠正 AI 的算法偏差,确保技术向善,比如处理用户数据时的隐私保护,面对利益诱惑时的合规把控;

长期战略与风险预判:能拆解长期目标、整合多领域资源,预判潜在风险,比如企业战略规划中的跨界协同,项目推进中的风险规避。

这种 “在不确定中找确定” 的决策能力,以及基于价值观的伦理判断,是人类作为 “决策者” 而非 “操作员” 的核心价值。

三、精细微操与实体交互:物理世界的 “实践掌控力”
AI 擅长虚拟场景的信息处理,但面对需要物理接触、现场应变的场景,人类的 “具身认知” 优势尽显:
精密技艺与细节把控:比如外科手术中的精准操作、文物修复的细致打磨、高端手工艺的个性化创作,需要触觉反馈与手眼协调的高度配合;

复杂环境适应与应变:能在高空、深海、高温等极端环境作业,或应对建筑维修、抢险救灾等非标准化场景,快速处理突发安全隐患;

实体世界的互动感知:通过身体感官感知物理环境的细微变化,比如电工排查线路故障、工程师调试设备,这种 “沉浸式实践” 是 AI 目前无法替代的。

四、创造力与创新思维:从0到1的 “颠覆式突破”
大模型能整合现有信息生成内容,但无法拥有 “打破常规、创造新价值” 的原创力:
颠覆性思维与跨域整合:能打破行业边界,将不同领域的知识联想融合,比如将科技与艺术结合创造新的表达形式,将商业模式与公益理念结合开辟新赛道;

原创表达与故事叙事:能构建宏大的世界观,讲述打动人心的故事,比如作家的文学创作、设计师的风格定义、品牌的情感化叙事;

问题重构与新解法探索:不局限于现有答案,而是重构问题框架,找到从 0 到 1 的创新方案,比如创业中的模式创新、科研中的技术突破。

这种 “无中生有” 的创造力,是推动社会进步的核心动力,也是 AI 难以企及的领域。

五、驾驭AI的能力:人机协作的 “指挥官思维”
未来的核心竞争力,不是 “对抗 AI”,而是 “用好 AI”—— 成为 AI 的 “导师” 和 “指挥官”:
精准指令工程与引导:掌握高阶提示词技巧,能清晰定义问题框架,引导 AI 输出高质量结果,而不是被动接受 AI 的默认答案;

AI输出的验证与转化:能判断 AI 内容的逻辑自治性,识别偏见与 “幻觉”,并将技术报告、AI 生成方案转化为可落地的商业成果;

工具整合与定制优化:能搭建多工具协同工作流,根据场景微调模型,让 AI 成为适配自身需求的 “专属助手”,比如运营中的高效统筹、工作中的流程优化。

这种 “人机协同” 的能力,能让 AI 成为释放人类精力的 “杠杆”,聚焦更高价值的工作。

六、自我进化与抗脆弱能力:终身成长的 “适应力”
大模型的迭代速度惊人,但人类的 “自我更新” 能力才是长期竞争力的关键:
终身学习与知识迁移:能快速适应新技术、跨领域学习,将所学知识灵活运用到新场景,比如从传统行业转型 AI 相关领域,将职场经验迁移到创业项目;

抗挫折与复盘优化:能从失败中提炼经验,在变化中快速调整,比如项目失利后的复盘改进、行业变革中的转型适应;

自我认知与定位校准:能清晰认识自身优势,校准个人价值定位,在人机互补的生态中找到不可替代的角色,比如深耕细分领域形成专业壁垒。

七、核心价值维度:不可复制的 “个人特质与生命体验”
每个人的独特经历、文化脉络、价值取向,构成了独一无二的 “个人品牌”,这也是不可替代的根源:
独特生命体验与风格:比如长期积累的行业洞察、个人化的表达风格、融入生命体验的创作灵感,这些都是 AI 无法模仿的;

多元价值与文化理解:对特定领域的深度积累、对文化脉络的精准把握,比如非遗传承人的文化坚守、行业专家的经验沉淀;

社会责任与人文担当:在追求个人价值的同时,兼顾社会价值,比如推动技术向善、参与公益事业,这种 “有温度的价值追求” 让人类的存在更有意义。

总结:大模型时代的 “生存逻辑”—— 人机互补,放大优势
大模型的出现,不是为了替代人类,而是为了让人类从重复性、标准化的工作中解放出来,聚焦更有价值的核心能力。未来的竞争,不再是 “谁做得快”,而是 “谁做得有温度、有深度、有创意”。

与其焦虑 AI 的冲击,不如深耕这些 “碳基生物核心能力”:用情感智慧建立连接,用创新思维创造价值,用决策能力掌控方向,用协作思维驾驭 AI。当人类的 “独特性” 与 AI 的 “高效性” 形成互补,就能实现 1+1>2 的效应,在大模型时代站稳脚跟。

你觉得自己最核心的 “不可替代能力” 是什么?在人机协作中,你有哪些实用技巧?欢迎在评论区留言交流~

大模型幻觉自动识别

关于大模型自动化幻觉识别的一些思考:
1、要求大模型输出参考文献、文献引用及数据更新时间
2、通过搜索引擎、RAG等工具,确认文献可信度
3、通过搜索引擎、RAG等工具,获取有没有最新的信息
4、对于风险高的情形,对比其他大模型结果(感觉成本好高)
5、通过小模型,判定置信度

领域大模型怎么用才高效?5大增强方法+2大开发范式,从入门到进阶

整理了一些领域大模型增强的技术方法:
领域大模型增强方法


领域大模型怎么用才高效?5大增强方法+2大开发范式,从入门到进阶

很多企业和个人用领域大模型时都会遇到困惑:“为什么模型输出的内容不够精准?”“怎么让模型快速掌握行业知识?” 其实领域大模型的核心价值,不在于 “基础模型多强”,而在于 “针对性增强”—— 通过数据、提示、工具的组合优化,让通用模型适配特定场景。今天就拆解领域大模型的增强方法和开发范式,帮你快速提升模型实用价值。

一、模型调整:选对 “底座”,精准补能
模型的 “底子” 和 “适配度”,直接决定了后续增强效果,核心分两步走:
第一步,基础模型选用
优先选生成质量高、上下文窗口足够长、推理能力强的模型作为底座 —— 比如处理长文档的法律合同解析,就需要大上下文模型;做复杂逻辑推理的金融分析,就侧重推理能力强的模型,避免 “小马拉大车”。

第二步,按需选择调整方式
1、不推荐多数企业做 “垂直大模型重新训练”:需要大量领域知识数据,成本超高、耗时极长,除非是头部企业且有核心场景刚需;

2、优先考虑 “模型微调”:注入较新的领域知识,比如将 2023-2024 年的行业新规、企业内部流程数据融入模型,适配性比通用模型强很多,但要注意 —— 核心是 “大量高质量数据”,数据质量直接决定微调效果;

3、少数据场景用 “Prompt 数据补充”:如果没有足够数据做微调,可将简单 QA、核心知识点直接嵌入 Prompt,让模型快速获取关键信息,比如给模型喂 “行业术语对照表”“常见问题解答”,快速提升专业度。

二、Prompt 优化:用 “精准指令” 让模型少走弯路
Prompt 是人和模型的 “沟通桥梁”,优化后能让模型输出质量翻倍,核心技巧有 4 个:
1、结构化提示:把需求拆分成清晰的模块,比如 “先分析问题核心→再列出解决方案→最后给出注意事项”,利于模型理解逻辑,避免输出混乱;

2、无效内容清理:去掉和需求无关的描述,比如问 “电商行业的用户留存策略”,就不用附带 “我是做互联网的,最近想提升业绩” 这类冗余信息,让模型聚焦核心问题;

3、领域限定与角色设定:明确场景边界和模型身份,比如 “假定你是电商运营专家,基于淘宝平台规则,分析美妆类目新店铺的用户留存方法”,限定条件 + 角色定位,让输出更精准;

4、思维链引导:通过少样本提示(给 1-2 个示例)或零样本提示(直接引导步骤),让模型一步步思考,比如 “先拆解用户流失的 3 个核心原因,再针对每个原因给出 2 个具体策略,最后说明落地优先级”,避免模型跳过关键步骤。

三、RAG 增强:给模型建 “专属知识库”,解决知识滞后问题
大模型的知识有 “截止日期”,而 RAG(检索增强生成)能让模型实时调用最新数据,核心逻辑是 “检索 + 生成”:
1、把大量领域数据(比如行业报告、企业内部文档、最新政策文件)整理后存入向量数据库,相当于给模型建了一个 “专属图书馆”;

2、当用户提问时,模型先从 “图书馆” 中检索相似的相关信息,再结合自身知识生成回答 —— 既解决了模型知识滞后的问题,又能让输出有具体数据支撑,比如问 “2024 年新能源汽车的补贴政策”,模型会从向量数据库中检索最新政策文件,精准回复。

3、关键注意点:做好元数据设计和向量数据库构建,定期更新数据,确保检索的准确性和时效性。

四、工具调用:让模型 “手脚并用”,拓展能力边界
纯文本模型的能力有限,搭配工具后能实现 “信息查询、数据分析、图表生成” 等复杂功能,核心场景包括:
1、联网搜索:获取实时信息,比如 “查询今日原油价格”“了解最新行业动态”,解决模型知识不更新的问题;

2、数据库查询:对接企业内部数据库,比如查询 “近 3 个月的销售数据”“用户画像统计”,直接基于真实业务数据生成分析报告;

3、数据分析与图表生成:自动处理 Excel 表格、生成柱状图 / 折线图,比如 “分析近半年的用户增长趋势,生成可视化图表并给出结论”;

4、关键支撑:通过 MCP(AI 工具调用标准)和 A2A(Agent 间通讯标准),实现不同工具、不同 Agent 之间的标准化调用,让协作更顺畅。

五、Agent 增强:让模型成为 “自主决策者”,搞定复杂任务
如果说工具调用是 “给模型加手脚”,那 Agent 就是 “给模型加大脑”,核心能力是 “自主规划 + 执行 + 调整”:
1、面对复杂任务,Agent 能自动拆解步骤,比如 “完成电商店铺的月度运营复盘”,会拆解为 “1. 调取近 30 天销售数据→2. 分析用户增长 / 流失情况→3. 对比行业均值→4. 找出核心问题→5. 给出优化策略→6. 生成复盘报告”;

2、过程中能自主选择工具,比如需要数据就调用数据库,需要行业对比就联网搜索,还能评估阶段性结果,比如发现 “销售数据异常”,会自动调整步骤,补充 “异常原因分析”;

3、适合场景:复杂流程优化、多步骤任务执行(如市场调研、项目规划),让模型从 “被动响应” 变成 “主动解决问题”。

六、两大核心开发范式:组合使用效果翻倍
单独用一种增强方法效果有限,推荐两种主流组合范式:
1、微调 + Prompt+RAG:适合需要深度适配领域的场景,比如企业内部的智能客服 —— 通过微调注入企业流程知识,用 Prompt 优化回复逻辑,用 RAG 调用最新的产品信息和售后政策,既专业又精准;

2、Agent+Tools:适合复杂任务处理,比如跨境电商的选品分析 ——Agent 拆解任务(市场调研→竞品分析→成本核算→风险评估),调用联网搜索(市场趋势)、数据库查询(成本数据)、数据分析工具(竞品销量),全程自主完成,高效落地。

总结:领域大模型的增强逻辑 ——“扬长避短,按需组合”
领域大模型的增强,不是 “越多方法越好”,而是 “按需选择”:
1、数据充足、场景固定→优先 “微调 + RAG”;
2、数据有限、需求灵活→优先 “Prompt 优化 + 工具调用”;
3、复杂任务、需要自主决策→用 “Agent+Tools”;
4、核心是让模型的 “推理能力” 结合 “领域知识” 和 “工具能力”,实现 1+1>2 的效果。

你在使用领域大模型时,遇到过哪些 “不精准”“不实用” 的问题?欢迎在评论区留言,一起探讨解决方案~

NEOHOPE大模型发展趋势预测2409

NEOHOPE大模型发展趋势预测2409
1、虽然ChatGPT-4o 和 OpenAI o1都有亮眼表现,但OpenAI仍未能突破瓶颈,GPT5发布遥遥无期
2、小模型化、移动化趋势越来越明显
3、多个领域模型能力组合,将逐步成为趋势
4、国内大模型厂商频频降价,将开始新一轮的清洗,部分厂商将陆续出局
5、开源大模型将会逐步侵占闭源模型市场
6、领域模型采用开源大模型将成为主流
7、逻辑推理能力有大幅加强,效率有待提升
8、美国对外大模型技术封锁会更加严格

一线厂商【主观】:
1、国外闭源:Claude、ChatGPT、Gemini
2、国外开源:Llama3、Mistral
3、国内闭源:月之暗面Kimi、智谱清言ChatGLM、秘塔搜索
4、国内开源:阿里通义千问

AI编程的现状

1,当前AI可大幅提升代码片段效率
当前的AI辅助工具,在通用代码片段上的效率,已经高过大多数程序员了。
比如让AI去写一个通用算法片段,其速度甚至质量可以吊打多数的程序员。
虽然很多通用代码片段都有现成的库可以参考,甚至可以直接调用,但自动输出一个良好的demo也能节约大量的搜索排错的时间,大幅提升开发效率。

2,当前AI可大幅提升学习速度
在进入一个新的技术领域时,AI可大幅降低程序员的学习成本。
一个AI生成的demo,稍微调整一下就能运行了。
所以有种可能,就是程序员会更加的全栈化。

3,当前AI有待进步
但如果是一个复杂的需求,尤其是需求需要建立在对一个项目前期需求理解之上时,现在的AI还是不够强大。
也就是有些人说的,AI很傻。

而且当前的软件项目结构,更适合人,而不是AI。
更小的代码片段,更小的项目拆分,对当前水平的AI会更友好。但对人来说并不一定。

4,近期AI会让编程技能更加工具化
比如一个做统计分析的人,用R或Python做统计,学习成本会下降一个数量级。
熟练的用函数,很难成为核心优势。

5,AI的进一步发展,会促使开发人员分级
善用工具的,会越来越强大
反之,会被迫与“被AI武装的外行人”竞争的囧境

6,AI的进一步发展,会让懂业务的人更强大
开发人员必须向上游靠拢,更深入的理解业务,才能有更好的发展。
纯拼技能熟练的时代,可能要结束了。

大模型时代需要强大的信息护盾

无论你周围的人,是否关注大模型,23年的ChatGPT的宫斗剧相信他应该还有些印象,毕竟都已经破圈了。

这件事情的起因,说白了就是“超级对齐派” 和 “激进派”之争。
“超级对齐派”希望,可以对预训练模型进行调整,让其符合人类的道德标准,但要付出更多的成本和时间,收获效果更差的模型。
“激进派”认为,这样很难满足投资人和用户的期望,公司根本无法生存。

“激进派”则希望,先满足大模型的商业价值,获取更多的投资和收入,然后再考虑“超级对齐”的事情。
“超级对齐派”认为,这样就相当于放出了洪水猛兽,会威胁到人类生存。

宫斗最终以“激进派”暂时获胜,“超级对齐派”基本离开OpenAI为结局。

当然,无论是业界大佬,还是各国政府,也都在积极呼吁,要对大模型进行立法管控,限制算力,防止“对人类造成不可挽回的影响”。

但立足于当前来看,以现在的AI能力来说,人为利用大模型创造虚假信息对社会造成负面影响,比“超级对齐派”的洪水猛兽恐怕来的更快。
而且更悲观的是,不管是否做了对齐,其实都可以通过调整,把预训练模型已经完成的对齐,重新解放,把猛兽再放出来。
毕竟,我们现在很难像科幻小说中,把“机器人三大定律”写入到机器人的固件中,并设置永不可更改。

如果没有强大的信息护盾,生成式AI很容易达成这些目的:
一、通过生成虚假信息(文字、图片、音频、视频),并可以达到以假乱真的效果,达到犯罪的目的
比如:通过视频通话,达到诈骗的目的

二、通过生成海量虚假信息,控制舆论
比如:通过伪造新闻,伪造评论,达到政治或军事目的

三、不断生成海量虚假信息,覆盖真实信息,改写历史
比如:将“窗前明月光”,在全网改为“窗前白月光”,经过几代人的不断灌输,慢慢就可以达到目的

这样的例子,我们可以举出很多。

是不是细思极恐。
聪明的你,有没有想到区块链的工作量证明:全人类在诗词上的纠正能力,也搞不过机器不是么。
当虚假信息达到99%的时候,
一个新诞生的人,会相信哪个信息呢?

人类从来无法从历史中学到教训。
只要有足够利益,就一定有人,用不正当的方法,利用新技术。
所以说,我们虽然还没到必须“超级对齐”的时代。但当前的AI技术,如果不尽快去管控使用方式,势必会给未来的我们,会造成巨大的损失。
我们需要强大的信息护盾!
亟需!

退一万步说,就算是不这样被大规模利用。
我们上一代人、我们这代人、我们下一代人,也要学会“区分是否为AI”的技巧。
但随着AI技术进步,这个技巧的习得,将越来越难。

小模型时代到来

最近有一个很有意思的现象,就是各大厂商的大模型,参数级别“越来越小”。
今年上半年个厂商在不断的增加模型参数量,动辄千万参数。
下半年各厂商发布模型时,却都会不约而同的带上了性能不错的“小模型”,无论是ChatGPT、Llamma、Mistral、通义千问、谷歌、微软还是苹果,都是如此。

出现这种现象的原因有:

1、投资方需要看到盈利的趋势,需要降低成本
各大模型厂商,前期纯烧钱阶段已高于段落,需要考虑逐步盈利,一方面要加大收入来源,一方面要降低推理成本
降低模型规模,进行模型量化,是最直接的降低成本的方法

2、“小模型”效果大幅提升,比大模型差不太多
这种提升主要来自于两方面,一方面“小模型”调优技术越发成熟,另一方面数据集越来越准确
最终使得“小模型”参数规模下降了一两个数量级后,仍可达到大模型70%~80%的水平

3、从通用化需求,转为专业化需求
之前大模型追求的是通用,也就是拥有几乎各行各业的专业知识
现在的“小模型”,不需要去吟诗作赋,只需要掌握某个领域的特定专业知识就好,但准确性要更高,对数据和调优要求就更高

4、单卡推理,进一步降低成本
仔细研究“小模型”后,会发现部分模型恰好可以在主流单GPU上运行
这样会避免在多显卡之间通讯或传递数据,推理性能会进一步提升
同样的,部署和调度的难度会大幅下降,稳定性会进一步提升

5、移动需求
无论是微软还是苹果,都在积极探索,让“小模型”可以在移动设备上顺畅运行
一方面可以利用终端算力,提升响应效率,降低服务端推理成本
另一方面可以规避或降低数据隐私的风险,会得到大企业的欢迎

现在模型已经进入下半场,通用模型的竞争格局已比较明显,不会再是大家角逐的重点
各类垂直行业的“小模型”,开始入场厮杀
这个过程中,会诞生一些2C的“小模型”,但更多的商机在各大公司的行业垂直模型,开始卷起来