LLM – Neohope的网络笔记

NEOHOPE大模型发展趋势预测2601

Posted on 2026/01/18 by neohope — No Comments ↓

NEOHOPE大模型发展趋势预测2601
1、基础模型比赛已结束，能胜出的就头部这几家，开源模型市场更大
2、技术迭代，会导致基础模型价格进一步降低，其他模型厂商向杀入战局越来越难
3、大模型向垂直领域迁移动作明显：大厂商开始大力推进垂直领域模型
4、各垂直领域头部企业会握紧数据，加大开源大模型的开发应用，各大应用会进一步融入AI能力
5、端云模型应用场景进一步增多，小模型会更加被重视
6、头部大模型应用，逐步进入收费时代，可以盈利逐步成为各大模型团队KPI
7、大模型相关应用进一步爆发，在短视频、非现实文学创作、医疗健康等方面，大模型会进一步发力

一线厂商【主观】：
1、国外闭源：ChatGPT、Claude、Gemini
2、国外开源：Mistral
3、国内闭源：豆包、千问商业版、智谱商业版、月之暗面
4、国内开源：千问、DeepSeek、智谱

其他有机会或有能力入局的厂商：
国外：X、Meta、微软、苹果、亚马逊
国内：腾讯、华为

大模型时代学习方法小结

Posted on 2026/01/11 by neohope — No Comments ↓

最近和几个朋友聊天的时候，大家稍微总结了一下大模型时代要如何快速学习，汇总了几个典型的方式：

方法1：在你有一定了解的领域，把AI当做有无限耐心的老师，无限提问法
1、当你想深入了解一个事情的时候，可以用清晰的命令描述好自己的问题，去多个AI同时发送该问题。
2、对每个AI反馈的内容进行初筛，最终保留2~3个候选AI
3、用靠谱的那个AI，去进一步咨询自己想理解的问题
4、不断的拓展问题的广度和深度，在这个过程中，最好记录一个思维导图，对于想进一步理解的点，做好标记
5、用适合自己的学习方式，把这些知识点逐一搞清楚
6、当AI不断说车轱辘话的时候，先更换说书，后尝试备选AI
7、一个不理解、但很重要的知识点，多发给几个AI，让他们交叉验证
8、请AI把整个过程的资料，梳理为笔记或思维导图
其实大家可以看到，知识面比较广的、求知欲强的、能提出好问题的、有一定较真精神的人，在AI时代会有更多的优势

方法2、在你很不了解的领域，把AI当做向导
1、当你想了解一个陌生事情的时候，可以要求AI先对该领域知识做一个思维导图的摘要，去多个AI同时发送该问题
2、对每个AI反馈的内容进行初筛，最终保留2~3个候选AI，此时你对这个领域有了初步的理解
3、对你感兴趣的要点，要求AI对思维导图进行扩展，并多举示例
4、对其中某个细节问题，不清楚的，调整到“方法1”
5、关键点要做好交叉验证
6、请AI把整个过程的资料，梳理为笔记或思维导图
其实大家可以看到，在AI的加持下，很多技术的专业护城河，已经消失了。在一个行业不够纵深的人，会变得难以生存。以后，行业新人很可能会变得更难找好的工作，因为门槛没了，谁都能做。

方法3、一个任务多用几个AI，让他们相互印证补充
先把一个问题描述清楚，约定好输出格式和输出要求，同时发给A、B、C、D四个模型。
先判断哪个模型输出效果最好，比如模型A。
将其他模型B、C、D的输出，给到模型A，要求进行检查及补充。
然后要A，进行检查补充。
然后把A最后的信息，给到第二好的B，再进行检查及补充。
一般来说，此时输出质量就很高了，如果不行就再来一轮。

方法4、日常工作生活中，把AI当做助理或外脑
相信这方面大家都会有很多尝试，从写总结报告到完成PPT，从画Excel表格到写简单代码，从P图到做视频。
在大模型当前技术水平下，大家记住一点就行：AI方便时用AI，人方便时用人，效能优先，不要纠结。

方法5、读代码时，让AI补充注释，然后对重点代码进行详细解释
相信不少同学都在用AI写代码。
但用AI去读代码也是很爽的，包括平时很少用的语言，也是很容易读懂，推荐大家试试。

划重点：快速调整自己，适配AI时代
在AI时代，几乎每个人都要抛弃过去思考、学习和工作的习惯，需要重新训练自己的思维方式，重新调整学习和工作的方法。
只有快速适应这个时代，才能快速越过“AI斩杀线”，去碾压别人，而不是被别人碾压。

目前能看到的趋势有：
1、有业务经验、能驾驭好AI工具的人，最受欢迎
2、没业务经验、能驾驭好AI工具的人，次之
3、有业务经验、不能驾驭好AI工具的人，受到冲击最大
4、没业务有经验、不能驾驭好AI工具的人，在部分行业很难生存
5、有想法、能驾驭好AI工具的人，会爆发
6、没想法的人，会吃亏

大模型为啥能 “记住” 你？揭秘 AI 背后的 “用户记忆逻辑”

Posted on 2026/01/11 by neohope — No Comments ↓

根据Manthan Gupta在X上的分享，整理了一下大模型是如何记住你的：

大模型为啥能 “记住” 你？揭秘 AI 背后的 “用户记忆逻辑”

有没有发现，现在的大模型越来越懂你？聊过的话题、喜欢的沟通风格、甚至不经意提过的家人信息，它都能精准呼应 —— 这背后不是 AI 有了 “超能力”，而是一套完善的用户记忆体系在发挥作用。今天就拆解大模型的 “记忆逻辑”，看看它到底在悄悄记录哪些信息，又是如何让互动更有 “人情味” 的。

一、基础信息：搭建你的 “用户画像骨架”
大模型的记忆从 “基础信息采集” 开始，这些数据是构建用户画像的核心，也是精准互动的前提：
终端与场景信息：比如你所在的市区、访问日期、使用的系统（Windows/MacOS）、浏览器（Chrome/Safari）、进入对话的入口、设备分辨率等，这些信息能帮 AI 适配不同场景（比如移动端优化回复长度）；

账号与活跃度数据：会员级别、账号注册年限、近 7 天 / 30 天的互动频率，能让 AI 判断你是新用户还是核心用户，调整服务优先级（比如会员用户获得更细致的记忆服务）；

核心身份标签：你的工作领域、具体工种（比如 “互联网运营”“教师”“工程师”），会直接影响 AI 的回复专业度 —— 给运营聊 “转化率”，给教师聊 “教学设计”，精准匹配行业语境。

二、偏好与习惯：填充 “个性化细节”
如果说基础信息是 “骨架”，那偏好与习惯就是让画像 “活起来” 的关键，也是大模型 “懂你” 的核心体现：
内容与价值观偏好：你感兴趣的话题（比如科技、育儿、职场）、隐含的价值观倾向（比如注重效率、偏爱温和表达），会让 AI 调整内容方向 —— 你喜欢干货，就少些铺垫；你关注育儿，就主动关联相关话题；

沟通风格适配：你的对话节奏（比如简洁短句 vs 详细长文）、常用语气（比如正式 vs 口语化），AI 都会默默记录，慢慢调整回复风格，形成 “专属沟通默契”；

模型使用偏好：比如你习惯用 AI 做文案生成，还是问题解答，或是数据分析，AI 会优先优化你高频使用的功能，让操作更顺手。

三、关系与深度信息：触碰 “情感连接点”
优秀的大模型不仅能提供服务，还能建立情感共鸣，这离不开对 “深度关系信息” 的记忆：
个人生活关联：你聊过的家人情况（比如 “有个上小学的孩子”“父母喜欢旅游”）、身边重要的人和事，AI 会妥善记录，后续对话中自然呼应（比如你说 “想规划假期”，AI 会关联 “父母喜欢旅游” 的信息推荐方案）；

话题深度轨迹：通过分析你话题的深度、平均消息长度、对话持续时间，AI 能判断你是 “浅尝辄止” 还是 “深入探讨” 型用户 —— 对前者提供简洁结论，对后者补充细节和延伸内容，贴合你的沟通需求。

四、对话内容：精准复刻 “互动轨迹”
除了静态信息，大模型对 “动态对话内容” 的记忆更是核心，主要分两层：
当前对话全记录：对你正在进行的对话内容做 “十分细致” 的存储，包括每一句提问、回应、补充说明，确保上下文连贯 —— 比如你中途提到 “刚才说的方案再调整下”，AI 能精准定位到之前的方案细节，不用你重复说明；

历史对话摘要：对近期 10~20 轮对话做 “十分精简” 的话题摘要，提炼核心信息（比如 “上周聊过短视频脚本创作，用户需要职场类选题”），既节省存储资源，又能快速唤醒历史记忆，避免 “聊过就忘”。

总结：大模型的 “记忆本质”—— 让 AI 从 “工具” 变成 “专属助手”
其实大模型的记忆逻辑很简单：从 “基础信息” 到 “偏好习惯”，再到 “深度关系” 和 “对话轨迹”，层层递进记录与你相关的关键信息，最终实现 “千人千面” 的个性化互动。

它不会无差别存储所有信息，而是 “抓重点”—— 有用的细节记牢，冗余的内容精简，既保证互动的精准度，又兼顾效率。这种记忆不是 “监控”，而是 AI 服务的核心竞争力：当大模型能记住你的需求、适配你的习惯、呼应你的情感，它就不再是冷冰冰的工具，而是能懂你、帮你、陪你成长的 “专属助手”。

你有没有遇到过让你惊艳的 “AI 记忆时刻”？或者你希望大模型记住哪些信息、忽略哪些内容？欢迎在评论区留言交流～

大模型时代，人类的核心竞争力：7 种不可替代的 “碳基生物能力”

Posted on 2026/01/11 by neohope — No Comments ↓

咨询了一下各大模型，大模型时代碳基生物核心能力：

大模型时代，人类的核心竞争力：7 种不可替代的 “碳基生物能力”

当 AI 能写文案、做分析、解难题，甚至替代部分重复性工作时，很多人开始焦虑：“人类的价值在哪里？” 其实答案很明确 —— 大模型能高效处理 “标准化任务”，但人类独有的 “情感温度、创造性思维、复杂决策力” 等核心能力，才是不可替代的立身之本。今天就拆解大模型时代，人类最该深耕的 7 种 “碳基生物核心能力”，帮你找准竞争力锚点。

一、人性温度与情感智慧：AI 无法复制的 “情感连接力”
机器能识别情绪，但永远无法真正 “共情”；能输出安慰的话术，却没有发自内心的人文关怀 —— 这正是人类的核心优势：
深度共情与理解：能站在他人角度思考问题，读懂语言背后的情绪、委屈与期待，比如医患沟通中安抚患者焦虑，心理咨询中感知隐性需求；

情感调节与关系构建：不仅能识别情绪，还能调节氛围、化解人际冲突，建立信任与亲密关系，比如团队管理中的激励引导、跨部门协作中的矛盾调解；

文化敏感与价值传递：理解不同文化背景的差异，兼顾人文关怀与价值观引导，比如教育中塑造孩子的正向品格，跨文化沟通中避免误解。

这种 “有温度的连接”，是 AI 再精准的算法也无法复刻的，也是人际关系、客户服务、教育医疗等领域的核心需求。

二、复杂决策与伦理判断：不确定性中的 “价值锚点”
大模型能提供数据支持和方案选项，但面对模糊地带、多方利益冲突时，最终的决策力仍属于人类：
模糊问题处理与决断：在信息不全、环境不确定的情况下，能权衡多变量利弊，做出合理决断，比如商业运营中应对突发市场变化，危机事件中的快速响应；

伦理权衡与价值校准：在道德困境中坚守底线，纠正 AI 的算法偏差，确保技术向善，比如处理用户数据时的隐私保护，面对利益诱惑时的合规把控；

长期战略与风险预判：能拆解长期目标、整合多领域资源，预判潜在风险，比如企业战略规划中的跨界协同，项目推进中的风险规避。

这种 “在不确定中找确定” 的决策能力，以及基于价值观的伦理判断，是人类作为 “决策者” 而非 “操作员” 的核心价值。

三、精细微操与实体交互：物理世界的 “实践掌控力”
AI 擅长虚拟场景的信息处理，但面对需要物理接触、现场应变的场景，人类的 “具身认知” 优势尽显：
精密技艺与细节把控：比如外科手术中的精准操作、文物修复的细致打磨、高端手工艺的个性化创作，需要触觉反馈与手眼协调的高度配合；

复杂环境适应与应变：能在高空、深海、高温等极端环境作业，或应对建筑维修、抢险救灾等非标准化场景，快速处理突发安全隐患；

实体世界的互动感知：通过身体感官感知物理环境的细微变化，比如电工排查线路故障、工程师调试设备，这种 “沉浸式实践” 是 AI 目前无法替代的。

四、创造力与创新思维：从0到1的 “颠覆式突破”
大模型能整合现有信息生成内容，但无法拥有 “打破常规、创造新价值” 的原创力：
颠覆性思维与跨域整合：能打破行业边界，将不同领域的知识联想融合，比如将科技与艺术结合创造新的表达形式，将商业模式与公益理念结合开辟新赛道；

原创表达与故事叙事：能构建宏大的世界观，讲述打动人心的故事，比如作家的文学创作、设计师的风格定义、品牌的情感化叙事；

问题重构与新解法探索：不局限于现有答案，而是重构问题框架，找到从 0 到 1 的创新方案，比如创业中的模式创新、科研中的技术突破。

这种 “无中生有” 的创造力，是推动社会进步的核心动力，也是 AI 难以企及的领域。

五、驾驭AI的能力：人机协作的 “指挥官思维”
未来的核心竞争力，不是 “对抗 AI”，而是 “用好 AI”—— 成为 AI 的 “导师” 和 “指挥官”：
精准指令工程与引导：掌握高阶提示词技巧，能清晰定义问题框架，引导 AI 输出高质量结果，而不是被动接受 AI 的默认答案；

AI输出的验证与转化：能判断 AI 内容的逻辑自治性，识别偏见与 “幻觉”，并将技术报告、AI 生成方案转化为可落地的商业成果；

工具整合与定制优化：能搭建多工具协同工作流，根据场景微调模型，让 AI 成为适配自身需求的 “专属助手”，比如运营中的高效统筹、工作中的流程优化。

这种 “人机协同” 的能力，能让 AI 成为释放人类精力的 “杠杆”，聚焦更高价值的工作。

六、自我进化与抗脆弱能力：终身成长的 “适应力”
大模型的迭代速度惊人，但人类的 “自我更新” 能力才是长期竞争力的关键：
终身学习与知识迁移：能快速适应新技术、跨领域学习，将所学知识灵活运用到新场景，比如从传统行业转型 AI 相关领域，将职场经验迁移到创业项目；

抗挫折与复盘优化：能从失败中提炼经验，在变化中快速调整，比如项目失利后的复盘改进、行业变革中的转型适应；

自我认知与定位校准：能清晰认识自身优势，校准个人价值定位，在人机互补的生态中找到不可替代的角色，比如深耕细分领域形成专业壁垒。

七、核心价值维度：不可复制的 “个人特质与生命体验”
每个人的独特经历、文化脉络、价值取向，构成了独一无二的 “个人品牌”，这也是不可替代的根源：
独特生命体验与风格：比如长期积累的行业洞察、个人化的表达风格、融入生命体验的创作灵感，这些都是 AI 无法模仿的；

多元价值与文化理解：对特定领域的深度积累、对文化脉络的精准把握，比如非遗传承人的文化坚守、行业专家的经验沉淀；

社会责任与人文担当：在追求个人价值的同时，兼顾社会价值，比如推动技术向善、参与公益事业，这种 “有温度的价值追求” 让人类的存在更有意义。

总结：大模型时代的 “生存逻辑”—— 人机互补，放大优势
大模型的出现，不是为了替代人类，而是为了让人类从重复性、标准化的工作中解放出来，聚焦更有价值的核心能力。未来的竞争，不再是 “谁做得快”，而是 “谁做得有温度、有深度、有创意”。

与其焦虑 AI 的冲击，不如深耕这些 “碳基生物核心能力”：用情感智慧建立连接，用创新思维创造价值，用决策能力掌控方向，用协作思维驾驭 AI。当人类的 “独特性” 与 AI 的 “高效性” 形成互补，就能实现 1+1>2 的效应，在大模型时代站稳脚跟。

你觉得自己最核心的 “不可替代能力” 是什么？在人机协作中，你有哪些实用技巧？欢迎在评论区留言交流～

大模型幻觉自动识别

Posted on 2025/12/06 by neohope — No Comments ↓

关于大模型自动化幻觉识别的一些思考：
1、要求大模型输出参考文献、文献引用及数据更新时间
2、通过搜索引擎、RAG等工具，确认文献可信度
3、通过搜索引擎、RAG等工具，获取有没有最新的信息
4、对于风险高的情形，对比其他大模型结果（感觉成本好高）
5、通过小模型，判定置信度

领域大模型怎么用才高效？5大增强方法+2大开发范式，从入门到进阶

Posted on 2025/10/07 by neohope — No Comments ↓

整理了一些领域大模型增强的技术方法：
领域大模型增强方法

领域大模型怎么用才高效？5大增强方法+2大开发范式，从入门到进阶

很多企业和个人用领域大模型时都会遇到困惑：“为什么模型输出的内容不够精准？”“怎么让模型快速掌握行业知识？” 其实领域大模型的核心价值，不在于 “基础模型多强”，而在于 “针对性增强”—— 通过数据、提示、工具的组合优化，让通用模型适配特定场景。今天就拆解领域大模型的增强方法和开发范式，帮你快速提升模型实用价值。

一、模型调整：选对 “底座”，精准补能
模型的 “底子” 和 “适配度”，直接决定了后续增强效果，核心分两步走：
第一步，基础模型选用
优先选生成质量高、上下文窗口足够长、推理能力强的模型作为底座 —— 比如处理长文档的法律合同解析，就需要大上下文模型；做复杂逻辑推理的金融分析，就侧重推理能力强的模型，避免 “小马拉大车”。

第二步，按需选择调整方式
1、不推荐多数企业做 “垂直大模型重新训练”：需要大量领域知识数据，成本超高、耗时极长，除非是头部企业且有核心场景刚需；

2、优先考虑 “模型微调”：注入较新的领域知识，比如将 2023-2024 年的行业新规、企业内部流程数据融入模型，适配性比通用模型强很多，但要注意 —— 核心是 “大量高质量数据”，数据质量直接决定微调效果；

3、少数据场景用 “Prompt 数据补充”：如果没有足够数据做微调，可将简单 QA、核心知识点直接嵌入 Prompt，让模型快速获取关键信息，比如给模型喂 “行业术语对照表”“常见问题解答”，快速提升专业度。

二、Prompt 优化：用 “精准指令” 让模型少走弯路
Prompt 是人和模型的 “沟通桥梁”，优化后能让模型输出质量翻倍，核心技巧有 4 个：
1、结构化提示：把需求拆分成清晰的模块，比如 “先分析问题核心→再列出解决方案→最后给出注意事项”，利于模型理解逻辑，避免输出混乱；

2、无效内容清理：去掉和需求无关的描述，比如问 “电商行业的用户留存策略”，就不用附带 “我是做互联网的，最近想提升业绩” 这类冗余信息，让模型聚焦核心问题；

3、领域限定与角色设定：明确场景边界和模型身份，比如 “假定你是电商运营专家，基于淘宝平台规则，分析美妆类目新店铺的用户留存方法”，限定条件 + 角色定位，让输出更精准；

4、思维链引导：通过少样本提示（给 1-2 个示例）或零样本提示（直接引导步骤），让模型一步步思考，比如 “先拆解用户流失的 3 个核心原因，再针对每个原因给出 2 个具体策略，最后说明落地优先级”，避免模型跳过关键步骤。

三、RAG 增强：给模型建 “专属知识库”，解决知识滞后问题
大模型的知识有 “截止日期”，而 RAG（检索增强生成）能让模型实时调用最新数据，核心逻辑是 “检索 + 生成”：
1、把大量领域数据（比如行业报告、企业内部文档、最新政策文件）整理后存入向量数据库，相当于给模型建了一个 “专属图书馆”；

2、当用户提问时，模型先从 “图书馆” 中检索相似的相关信息，再结合自身知识生成回答 —— 既解决了模型知识滞后的问题，又能让输出有具体数据支撑，比如问 “2024 年新能源汽车的补贴政策”，模型会从向量数据库中检索最新政策文件，精准回复。

3、关键注意点：做好元数据设计和向量数据库构建，定期更新数据，确保检索的准确性和时效性。

四、工具调用：让模型 “手脚并用”，拓展能力边界
纯文本模型的能力有限，搭配工具后能实现 “信息查询、数据分析、图表生成” 等复杂功能，核心场景包括：
1、联网搜索：获取实时信息，比如 “查询今日原油价格”“了解最新行业动态”，解决模型知识不更新的问题；

2、数据库查询：对接企业内部数据库，比如查询 “近 3 个月的销售数据”“用户画像统计”，直接基于真实业务数据生成分析报告；

3、数据分析与图表生成：自动处理 Excel 表格、生成柱状图 / 折线图，比如 “分析近半年的用户增长趋势，生成可视化图表并给出结论”；

4、关键支撑：通过 MCP（AI 工具调用标准）和 A2A（Agent 间通讯标准），实现不同工具、不同 Agent 之间的标准化调用，让协作更顺畅。

五、Agent 增强：让模型成为 “自主决策者”，搞定复杂任务
如果说工具调用是 “给模型加手脚”，那 Agent 就是 “给模型加大脑”，核心能力是 “自主规划 + 执行 + 调整”：
1、面对复杂任务，Agent 能自动拆解步骤，比如 “完成电商店铺的月度运营复盘”，会拆解为 “1. 调取近 30 天销售数据→2. 分析用户增长 / 流失情况→3. 对比行业均值→4. 找出核心问题→5. 给出优化策略→6. 生成复盘报告”；

2、过程中能自主选择工具，比如需要数据就调用数据库，需要行业对比就联网搜索，还能评估阶段性结果，比如发现 “销售数据异常”，会自动调整步骤，补充 “异常原因分析”；

3、适合场景：复杂流程优化、多步骤任务执行（如市场调研、项目规划），让模型从 “被动响应” 变成 “主动解决问题”。

六、两大核心开发范式：组合使用效果翻倍
单独用一种增强方法效果有限，推荐两种主流组合范式：
1、微调 + Prompt+RAG：适合需要深度适配领域的场景，比如企业内部的智能客服 —— 通过微调注入企业流程知识，用 Prompt 优化回复逻辑，用 RAG 调用最新的产品信息和售后政策，既专业又精准；

2、Agent+Tools：适合复杂任务处理，比如跨境电商的选品分析 ——Agent 拆解任务（市场调研→竞品分析→成本核算→风险评估），调用联网搜索（市场趋势）、数据库查询（成本数据）、数据分析工具（竞品销量），全程自主完成，高效落地。

总结：领域大模型的增强逻辑 ——“扬长避短，按需组合”
领域大模型的增强，不是 “越多方法越好”，而是 “按需选择”：
1、数据充足、场景固定→优先 “微调 + RAG”；
2、数据有限、需求灵活→优先 “Prompt 优化 + 工具调用”；
3、复杂任务、需要自主决策→用 “Agent+Tools”；
4、核心是让模型的 “推理能力” 结合 “领域知识” 和 “工具能力”，实现 1+1>2 的效果。

你在使用领域大模型时，遇到过哪些 “不精准”“不实用” 的问题？欢迎在评论区留言，一起探讨解决方案～

NEOHOPE大模型发展趋势预测2409

Posted on 2024/09/28 by neohope — No Comments ↓

NEOHOPE大模型发展趋势预测2409
1、虽然ChatGPT-4o 和 OpenAI o1都有亮眼表现，但OpenAI仍未能突破瓶颈，GPT5发布遥遥无期
2、小模型化、移动化趋势越来越明显
3、多个领域模型能力组合，将逐步成为趋势
4、国内大模型厂商频频降价，将开始新一轮的清洗，部分厂商将陆续出局
5、开源大模型将会逐步侵占闭源模型市场
6、领域模型采用开源大模型将成为主流
7、逻辑推理能力有大幅加强，效率有待提升
8、美国对外大模型技术封锁会更加严格

一线厂商【主观】：
1、国外闭源：Claude、ChatGPT、Gemini
2、国外开源：Llama3、Mistral
3、国内闭源：月之暗面Kimi、智谱清言ChatGLM、秘塔搜索
4、国内开源：阿里通义千问

AI编程的现状

Posted on 2024/09/07 by neohope — No Comments ↓

1，当前AI可大幅提升代码片段效率
当前的AI辅助工具，在通用代码片段上的效率，已经高过大多数程序员了。
比如让AI去写一个通用算法片段，其速度甚至质量可以吊打多数的程序员。
虽然很多通用代码片段都有现成的库可以参考，甚至可以直接调用，但自动输出一个良好的demo也能节约大量的搜索排错的时间，大幅提升开发效率。

2，当前AI可大幅提升学习速度
在进入一个新的技术领域时，AI可大幅降低程序员的学习成本。
一个AI生成的demo，稍微调整一下就能运行了。
所以有种可能，就是程序员会更加的全栈化。

3，当前AI有待进步
但如果是一个复杂的需求，尤其是需求需要建立在对一个项目前期需求理解之上时，现在的AI还是不够强大。
也就是有些人说的，AI很傻。

而且当前的软件项目结构，更适合人，而不是AI。
更小的代码片段，更小的项目拆分，对当前水平的AI会更友好。但对人来说并不一定。

4，近期AI会让编程技能更加工具化
比如一个做统计分析的人，用R或Python做统计，学习成本会下降一个数量级。
熟练的用函数，很难成为核心优势。

5，AI的进一步发展，会促使开发人员分级
善用工具的，会越来越强大
反之，会被迫与“被AI武装的外行人”竞争的囧境

6，AI的进一步发展，会让懂业务的人更强大
开发人员必须向上游靠拢，更深入的理解业务，才能有更好的发展。
纯拼技能熟练的时代，可能要结束了。

大模型时代需要强大的信息护盾

Posted on 2024/08/10 by neohope — No Comments ↓

无论你周围的人，是否关注大模型，23年的ChatGPT的宫斗剧相信他应该还有些印象，毕竟都已经破圈了。

这件事情的起因，说白了就是“超级对齐派” 和 “激进派”之争。
“超级对齐派”希望，可以对预训练模型进行调整，让其符合人类的道德标准，但要付出更多的成本和时间，收获效果更差的模型。
“激进派”认为，这样很难满足投资人和用户的期望，公司根本无法生存。

“激进派”则希望，先满足大模型的商业价值，获取更多的投资和收入，然后再考虑“超级对齐”的事情。
“超级对齐派”认为，这样就相当于放出了洪水猛兽，会威胁到人类生存。

宫斗最终以“激进派”暂时获胜，“超级对齐派”基本离开OpenAI为结局。

当然，无论是业界大佬，还是各国政府，也都在积极呼吁，要对大模型进行立法管控，限制算力，防止“对人类造成不可挽回的影响”。

但立足于当前来看，以现在的AI能力来说，人为利用大模型创造虚假信息对社会造成负面影响，比“超级对齐派”的洪水猛兽恐怕来的更快。
而且更悲观的是，不管是否做了对齐，其实都可以通过调整，把预训练模型已经完成的对齐，重新解放，把猛兽再放出来。
毕竟，我们现在很难像科幻小说中，把“机器人三大定律”写入到机器人的固件中，并设置永不可更改。

如果没有强大的信息护盾，生成式AI很容易达成这些目的：
一、通过生成虚假信息（文字、图片、音频、视频），并可以达到以假乱真的效果，达到犯罪的目的
比如：通过视频通话，达到诈骗的目的

二、通过生成海量虚假信息，控制舆论
比如：通过伪造新闻，伪造评论，达到政治或军事目的

三、不断生成海量虚假信息，覆盖真实信息，改写历史
比如：将“窗前明月光”，在全网改为“窗前白月光”，经过几代人的不断灌输，慢慢就可以达到目的

这样的例子，我们可以举出很多。

是不是细思极恐。
聪明的你，有没有想到区块链的工作量证明：全人类在诗词上的纠正能力，也搞不过机器不是么。
当虚假信息达到99%的时候，
一个新诞生的人，会相信哪个信息呢？

人类从来无法从历史中学到教训。
只要有足够利益，就一定有人，用不正当的方法，利用新技术。
所以说，我们虽然还没到必须“超级对齐”的时代。但当前的AI技术，如果不尽快去管控使用方式，势必会给未来的我们，会造成巨大的损失。
我们需要强大的信息护盾！
亟需！

退一万步说，就算是不这样被大规模利用。
我们上一代人、我们这代人、我们下一代人，也要学会“区分是否为AI”的技巧。
但随着AI技术进步，这个技巧的习得，将越来越难。

小模型时代到来

Posted on 2024/08/04 by neohope — No Comments ↓

最近有一个很有意思的现象，就是各大厂商的大模型，参数级别“越来越小”。
今年上半年个厂商在不断的增加模型参数量，动辄千万参数。
下半年各厂商发布模型时，却都会不约而同的带上了性能不错的“小模型”，无论是ChatGPT、Llamma、Mistral、通义千问、谷歌、微软还是苹果，都是如此。

出现这种现象的原因有：

1、投资方需要看到盈利的趋势，需要降低成本
各大模型厂商，前期纯烧钱阶段已高于段落，需要考虑逐步盈利，一方面要加大收入来源，一方面要降低推理成本
降低模型规模，进行模型量化，是最直接的降低成本的方法

2、“小模型”效果大幅提升，比大模型差不太多
这种提升主要来自于两方面，一方面“小模型”调优技术越发成熟，另一方面数据集越来越准确
最终使得“小模型”参数规模下降了一两个数量级后，仍可达到大模型70%~80%的水平

3、从通用化需求，转为专业化需求
之前大模型追求的是通用，也就是拥有几乎各行各业的专业知识
现在的“小模型”，不需要去吟诗作赋，只需要掌握某个领域的特定专业知识就好，但准确性要更高，对数据和调优要求就更高

4、单卡推理，进一步降低成本
仔细研究“小模型”后，会发现部分模型恰好可以在主流单GPU上运行
这样会避免在多显卡之间通讯或传递数据，推理性能会进一步提升
同样的，部署和调度的难度会大幅下降，稳定性会进一步提升

5、移动需求
无论是微软还是苹果，都在积极探索，让“小模型”可以在移动设备上顺畅运行
一方面可以利用终端算力，提升响应效率，降低服务端推理成本
另一方面可以规避或降低数据隐私的风险，会得到大企业的欢迎

现在模型已经进入下半场，通用模型的竞争格局已比较明显，不会再是大家角逐的重点
各类垂直行业的“小模型”，开始入场厮杀
这个过程中，会诞生一些2C的“小模型”，但更多的商机在各大公司的行业垂直模型，开始卷起来