普通视图
-
Hacker News 热门

- Anthropic 的 Pro 计划中移除了 Claude CodeClaude Code removed from Anthropic''s Pro plan (claude.com)05:03 ↑ 138 HN Points
-
Buzzing

- 美国司法部指控“南方贫困法律中心”犯有银行欺诈罪DOJ Charges Southern Poverty Law Center With Bank Fraud (www.bloomberg.com)05:51
美国司法部指控“南方贫困法律中心”犯有银行欺诈罪
-
Buzzing
- 德意志银行消费者调查显示:比特币不会在2026年卷土重来Bitcoin''s comeback won''t happen in 2026: Deutsche Bank survey of consumers (finance.yahoo.com)04-20
德意志银行消费者调查显示:比特币不会在2026年卷土重来
-
Buzzing
- 据报道,在墨西哥一次缉毒行动中丧生的两名美国官员系中情局特工Two US officials who died after Mexico drug raid reported to be CIA agents (www.theguardian.com)02:11
据报道,在墨西哥一次缉毒行动中丧生的两名美国官员系中情局特工
-
Buzzing
- Stay On Credits — 探索如何让您的积分和旅行积分物尽其用Stay On Credits — Discover the best value for your points and travel credits (stayoncredits.com)05:50 Lobste Comment
Stay On Credits — 探索如何让您的积分和旅行积分物尽其用
-
Hacker News 热门

- Britannica11.org——1911年版《大英百科全书》的结构化版本Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica (britannica11.org)01:33 ↑ 101 HN Points
Britannica11.org——1911年版《大英百科全书》的结构化版本
稳定币市场变得过于稳定了
为什么中国的出口将持续增长
-
Buzzing
- 在实现奔跑和跳舞功能后,中国机器人企业将目光投向了家务领域After running and dancing, Chinese robot firms target household chores (reut.rs)03:35
在实现奔跑和跳舞功能后,中国机器人企业将目光投向了家务领域
-
谷歌全球新闻
- 报道称,俄罗斯篡改经济数据以掩盖战争造成的损失 - Euronews.comRussia faked economic data to mask damage from its war, report says (news.google.com)04-21 #Euronews.com
报道称,俄罗斯篡改经济数据以掩盖战争造成的损失 - Euronews.com
-
Buzzing

- 曾被中国拘留的加拿大公民警告称应警惕卡尼的汽车交易Canadian Who Was Detained by China Warns Against Carney’s Auto Deal (www.bloomberg.com)01:50
曾被中国拘留的加拿大公民警告称应警惕卡尼的汽车交易
-
安志合的学习博客
- 大模型 Temperature 与 Top_p/Top_k 参数详解这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项🔥 Temperature(温度)作用:控制输出分布的"尖锐度"模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:P'(word) ∝ P(word)^(1/T)Temperature 值 / 效果 / 适用场景T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)本质: 低温度让分布
大模型 Temperature 与 Top_p/Top_k 参数详解
这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:
Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。
Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项
🔥 Temperature(温度)
作用:控制输出分布的"尖锐度"
模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:
P'(word) ∝ P(word)^(1/T)
Temperature 值 / 效果 / 适用场景
T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务
T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出
T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景
T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演
T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)
本质: 低温度让分布更"尖锐",高温度让分布更"平缓"。
🎯 Top_p(Nucleus Sampling / 核采样)
作用:动态截断低概率词
与 Temperature 固定缩放不同,Top_p 按概率从高到低累加,直到累计概率达到 p 值,只保留这些词,从保留的这些词中采样:
例如 top_p=0.9: 选词 A(40%) + B(30%) + C(20%) = 90% → 保留 词 D(10%) 被截断
Top_p 值 / 效果 / 特点
0.1 ~ 0.3 — 极度保守,只选最高概率词 · 类似低 temperature,但更动态
0.7 ~ 0.9 — 主流推荐值 · 在多样性和质量间取得平衡
0.9 ~ 0.95 — 允许更多低概率词 · 创意性更强,偶尔会跑偏
1.0 — 不做截断,等价于关闭 · 不推荐,可能采样到无意义词
优势: 比 Temperature 更"智能"——当模型很确定时自动收窄,不确定时自动放宽。
💡 使用建议
通用原则
需要精确、低风险 → 低 temperature(0.1~0.3)+ 低 top-p(0.1~0.5)
需要创意、多样性 → 高 temperature(0.8~1.2)+ 高 top-p(0.9~1.0)
平衡模式(多数日常对话)→ temperature 0.7~0.8,top-p 0.9
常见场景推荐
任务类型 temperature top-p 说明 代码生成、数学解题 0.1~0.3 0.1~0.3 需要确定性高 事实问答、摘要 0.3~0.5 0.5~0.7 允许少量变化 通用客服/聊天 0.6~0.8 0.8~0.9 平衡流畅与多样性 故事/诗歌创作 0.8~1.2 0.9~1.0 鼓励惊喜 头脑风暴/创意构思 1.0~1.4 1.0 最大自由度,注意偶尔乱码
通用默认配置
temperature = 0.7 top_p = 0.9
这是大多数 API 的默认值,适合 80% 的场景
⚠️ 注意事项
不要同时设极值:T=0 + top_p=0.1 会导致输出极度单调
Temperature 优先调:多数情况下调 T 就够了,Top_p 保持 0.9 不动
需要确定性时用 T=0:此时 Top_p 失效(贪婪解码优先)
不同模型敏感度不同:同样参数在不同模型上效果可能差异较大
batch 生成时注意:同一 prompt 多次调用,参数相同也会得到不同结果
🔑 快速记忆
Temperature → "敢不敢冒险":越低越保守,越高越大胆
Top_p → "备选池多大":越低选择越少,越高越自由
两者配合 → T 定基调,Top_p 做微调
观点 我的孩子死于麻疹
蒂姆·库克的绝佳时机
-
Hacker News 热门

- 游戏业先驱路易斯·佐奇去世Louis Zocchi, games industry pioneer, has died (icv2.com)04-21 ↑ 101 HN Points
游戏业先驱路易斯·佐奇去世
-
Hacker News 热门

- Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件VidStudio, a browser based video editor that doesn''t upload your files (vidstudio.app)04-21 ↑ 108 HN Points #Show HN
Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件
定义犹太国家
-
Hacker News 热门

- 苹果无视关于DMA互操作性的请求,且与自身文档相矛盾Apple ignores DMA interoperability requests and contradicts own documentation (fsfe.org)04-21 ↑ 108 HN Points
苹果无视关于DMA互操作性的请求,且与自身文档相矛盾
-
Hacker News 热门
- Show HN: Mediator.ai – 利用纳什讨价还价和大型语言模型实现公平机制的系统化Mediator.ai – Using Nash bargaining and LLMs to systematize fairness (mediator.ai)04-20 ↑ 101 HN Points #Show HN

