普通视图
-
Hacker News 热门

- Britannica11.org——1911年版《大英百科全书》的结构化版本Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica (britannica11.org)01:33 ↑ 101 HN Points
稳定币市场变得过于稳定了
为什么中国的出口将持续增长
-
Buzzing
- 在实现奔跑和跳舞功能后,中国机器人企业将目光投向了家务领域After running and dancing, Chinese robot firms target household chores (reut.rs)03:35
在实现奔跑和跳舞功能后,中国机器人企业将目光投向了家务领域
-
谷歌全球新闻
- 报道称,俄罗斯篡改经济数据以掩盖战争造成的损失 - Euronews.comRussia faked economic data to mask damage from its war, report says (news.google.com)04-21 #Euronews.com
报道称,俄罗斯篡改经济数据以掩盖战争造成的损失 - Euronews.com
-
Buzzing

- 曾被中国拘留的加拿大公民警告称应警惕卡尼的汽车交易Canadian Who Was Detained by China Warns Against Carney’s Auto Deal (www.bloomberg.com)01:50
曾被中国拘留的加拿大公民警告称应警惕卡尼的汽车交易
-
安志合的学习博客
- 大模型 Temperature 与 Top_p/Top_k 参数详解这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项🔥 Temperature(温度)作用:控制输出分布的"尖锐度"模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:P'(word) ∝ P(word)^(1/T)Temperature 值 / 效果 / 适用场景T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)本质: 低温度让分布
大模型 Temperature 与 Top_p/Top_k 参数详解
这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:
Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。
Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项
🔥 Temperature(温度)
作用:控制输出分布的"尖锐度"
模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:
P'(word) ∝ P(word)^(1/T)
Temperature 值 / 效果 / 适用场景
T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务
T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出
T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景
T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演
T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)
本质: 低温度让分布更"尖锐",高温度让分布更"平缓"。
🎯 Top_p(Nucleus Sampling / 核采样)
作用:动态截断低概率词
与 Temperature 固定缩放不同,Top_p 按概率从高到低累加,直到累计概率达到 p 值,只保留这些词,从保留的这些词中采样:
例如 top_p=0.9: 选词 A(40%) + B(30%) + C(20%) = 90% → 保留 词 D(10%) 被截断
Top_p 值 / 效果 / 特点
0.1 ~ 0.3 — 极度保守,只选最高概率词 · 类似低 temperature,但更动态
0.7 ~ 0.9 — 主流推荐值 · 在多样性和质量间取得平衡
0.9 ~ 0.95 — 允许更多低概率词 · 创意性更强,偶尔会跑偏
1.0 — 不做截断,等价于关闭 · 不推荐,可能采样到无意义词
优势: 比 Temperature 更"智能"——当模型很确定时自动收窄,不确定时自动放宽。
💡 使用建议
通用原则
需要精确、低风险 → 低 temperature(0.1~0.3)+ 低 top-p(0.1~0.5)
需要创意、多样性 → 高 temperature(0.8~1.2)+ 高 top-p(0.9~1.0)
平衡模式(多数日常对话)→ temperature 0.7~0.8,top-p 0.9
常见场景推荐
任务类型 temperature top-p 说明 代码生成、数学解题 0.1~0.3 0.1~0.3 需要确定性高 事实问答、摘要 0.3~0.5 0.5~0.7 允许少量变化 通用客服/聊天 0.6~0.8 0.8~0.9 平衡流畅与多样性 故事/诗歌创作 0.8~1.2 0.9~1.0 鼓励惊喜 头脑风暴/创意构思 1.0~1.4 1.0 最大自由度,注意偶尔乱码
通用默认配置
temperature = 0.7 top_p = 0.9
这是大多数 API 的默认值,适合 80% 的场景
⚠️ 注意事项
不要同时设极值:T=0 + top_p=0.1 会导致输出极度单调
Temperature 优先调:多数情况下调 T 就够了,Top_p 保持 0.9 不动
需要确定性时用 T=0:此时 Top_p 失效(贪婪解码优先)
不同模型敏感度不同:同样参数在不同模型上效果可能差异较大
batch 生成时注意:同一 prompt 多次调用,参数相同也会得到不同结果
🔑 快速记忆
Temperature → "敢不敢冒险":越低越保守,越高越大胆
Top_p → "备选池多大":越低选择越少,越高越自由
两者配合 → T 定基调,Top_p 做微调
观点 我的孩子死于麻疹
蒂姆·库克的绝佳时机
-
Hacker News 热门

- 游戏业先驱路易斯·佐奇去世Louis Zocchi, games industry pioneer, has died (icv2.com)04-21 ↑ 101 HN Points
游戏业先驱路易斯·佐奇去世
-
Hacker News 热门

- Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件VidStudio, a browser based video editor that doesn''t upload your files (vidstudio.app)04-21 ↑ 108 HN Points #Show HN
Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件
定义犹太国家
-
Hacker News 热门

- 苹果无视关于DMA互操作性的请求,且与自身文档相矛盾Apple ignores DMA interoperability requests and contradicts own documentation (fsfe.org)04-21 ↑ 108 HN Points
苹果无视关于DMA互操作性的请求,且与自身文档相矛盾
-
Hacker News 热门
- Show HN: Mediator.ai – 利用纳什讨价还价和大型语言模型实现公平机制的系统化Mediator.ai – Using Nash bargaining and LLMs to systematize fairness (mediator.ai)04-20 ↑ 101 HN Points #Show HN
Show HN: Mediator.ai – 利用纳什讨价还价和大型语言模型实现公平机制的系统化
-
Hacker News 热门

- 软件工程法则Laws of Software Engineering (lawsofsoftwareengineering.com)04-21 ↑ 110 HN Points
软件工程法则
-
Hacker News 热门
- MNT Reform 是一款开放式硬件笔记本电脑,由德国设计并组装MNT Reform is an open hardware laptop, designed and assembled in Germany (mnt.stanleylieber.com)04-20 ↑ 104 HN Points
MNT Reform 是一款开放式硬件笔记本电脑,由德国设计并组装
-
土法炼钢兴趣小组的博客
- 【可观测性工程】可观测性全景:Metrics、Logs、Traces、Profiles、Events 五大支柱从控制论到云原生:拆解可观测性的五大信号支柱,对比监控与可观测性的本质区别,梳理开源/商业/SaaS 分类,以及国内互联网公司三大支柱落地现状与典型工程坑点。
【可观测性工程】可观测性全景:Metrics、Logs、Traces、Profiles、Events 五大支柱
-
土法炼钢兴趣小组的博客
- 【可观测性工程】eBPF 可观测性全景:bcc、bpftrace、libbpf 的工程路径eBPF 如何实现零侵入、内核级、低开销的可观测性:从 kprobe/uprobe/tracepoint/fentry 钩子机制,到 bcc 工具集、bpftrace 脚本语言、libbpf+CO-RE 可移植编程,再到 Pixie、DeepFlow、Grafana Beyla 等商业化工具,结合内核版本兼容性与生产部署实战。
【可观测性工程】eBPF 可观测性全景:bcc、bpftrace、libbpf 的工程路径
-
土法炼钢兴趣小组的博客
- 【开源许可与版权工程】开源世界全景:从 GNU 到大模型的四十年一篇写给中国工程团队的开源世界地图:从 1983 年 Richard Stallman 发起 GNU 项目、1998 年 OSI 成立、2018 年 MongoDB 更改 SSPL,到 2020 年开放原子开源基金会成立、再到 2024 年大模型时代的 OpenRAIL 与 LLaMA 许可,把四十年的关键事件、基金会、协议演进和中国线索串成一张可直接指导选型的全景图。

