阅读视图

发现新文章，点击刷新页面。

Britannica11.org——1911年版《大英百科全书》的结构化版本

Hacker News 热门

ahaspel

2026年4月22日 03:55

Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica (britannica11.org)

Britannica11.org——1911年版《大英百科全书》的结构化版本

Buzzing

ahaspel

2026年4月22日 03:55

Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica (britannica11.org)

稳定币市场变得过于稳定了

Buzzing

2026年4月22日 03:55

The stablecoin market has got too stable (www.economist.com)

为什么中国的出口将持续增长

Buzzing

2026年4月22日 03:55

Why China’s exports will keep on rising (www.economist.com)

Roblox就儿童安全问题与各州达成和解，支付3580万美元

Buzzing

2026年4月22日 03:55

Roblox Settles With States For 35.8 Million Over Child Safety (www.bloomberg.com)

观点美国老年人正囤积着美国的潜力

Buzzing

The New York Times

2026年4月22日 03:55

Opinion Older Americans Are Hoarding America’s Potential (nyti.ms)

杰夫·贝索斯那次失败的太空发射如此惨烈，甚至可能危及美国宇航局整个登月计划 - Futurism

Buzzing

2026年4月22日 03:55

Jeff Bezos'' Botched Space Launch Was So Bad It Could Threaten NASA''s Entire Moon Program (news.google.com)

Show HN: 嗯——为多模态文件重新构建的 Unix 工具（find/cat/grep）

Buzzing

visioninmyblood

2026年4月22日 03:55

Mm – Unix tools (find/cat/grep) rebuilt for multimodal files (vlm-run.github.io)

Show HN: “百万美元主页”，21年后，以聪为单位计价

Buzzing

bigryanhacks

2026年4月22日 03:55

Million Dollar Homepage, 21 years later, priced in satoshis (twentyonebitcoinhomepage.com)

Show HN: Humanoid.js – 一个通过单个 HTML 文件来评估你的点击行为有多像人类的工具

Buzzing

informal007

2026年4月22日 03:55

Humanoid.js – One HTML file that scores how human your clicks look (humanoid-js.bensontech.dev)

美国法官叫停了特朗普政府阻碍风能和太阳能项目的举措

Buzzing

Reuters

2026年4月22日 03:55

US judge blocks Trump administration actions stymieing wind, solar projects (reut.rs)

在实现奔跑和跳舞功能后，中国机器人企业将目光投向了家务领域

Buzzing

Reuters

2026年4月22日 03:55

After running and dancing, Chinese robot firms target household chores (reut.rs)

英冠联赛的俱乐部拒绝采用VAR系统

Buzzing

2026年4月22日 03:55

English clubs reject VAR system in the Championship (news.sky.com)

英国通信管理局（Ofcom）正在调查有关Telegram上涉嫌传播儿童性虐待材料的指控

Buzzing

2026年4月22日 03:55

Ofcom investigating alleged sharing of child sexual abuse material on Telegram (news.sky.com)

在加利福尼亚州，以色列问题正逐渐成为检验民主党立场的重要试金石

Buzzing

Politico

2026年4月22日 03:55

In California, Israel is emerging as a defining Democratic test (www.politico.com)

《Blighty通讯》：如何培养一名英国选民

Buzzing

2026年4月22日 02:03

Blighty newsletter: How to build a British voter (www.economist.com)

全球混合动力及电动汽车销量预测

Buzzing

2026年4月22日 02:03

Global hybrid & electric vehicle sales forecast (finance.yahoo.com)

大模型 Temperature 与 Top_p/Top_k 参数详解

安志合的学习博客

anzhihe

2026年4月22日 00:07

这两个参数都用于控制大模型输出的随机性和多样性，是调整模型行为最重要的超参数，但机制不同。简单理解：

Temperature（温度）：控制概率分布的“陡峭”程度，影响整体随机性。
Top-p（也称核采样）：限制候选词的累积概率范围，动态过滤掉极不可能的选项

🔥 Temperature（温度）

作用：控制输出分布的"尖锐度"

模型在生成每个 token 时，会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换：

P'(word) ∝ P(word)^(1/T)

Temperature 值 / 效果 / 适用场景

T = 0（或极低） — 始终选概率最高的词，输出完全确定 · 代码生成、数学计算、需要确定性答案的任务

T = 0.1~0.3 — 高度保守，几乎总是选最优解 · 事实问答、信息抽取、严格格式输出

T = 0.5~0.7 — 平衡随机性，主流默认值 · 通用对话、写作辅助、大多数场景

T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演

T > 1.0 — 高度随机，可能产生无意义内容 · 艺术创作、探索性实验（不推荐日常使用）

本质： 低温度让分布更"尖锐"，高温度让分布更"平缓"。

🎯 Top_p（Nucleus Sampling / 核采样）

作用：动态截断低概率词

与 Temperature 固定缩放不同，Top_p 按概率从高到低累加，直到累计概率达到 p 值，只保留这些词，从保留的这些词中采样：

例如 top_p=0.9：
选词 A(40%) + B(30%) + C(20%) = 90% → 保留
词 D(10%) 被截断

Top_p 值 / 效果 / 特点

0.1 ~ 0.3 — 极度保守，只选最高概率词 · 类似低 temperature，但更动态

0.7 ~ 0.9 — 主流推荐值 · 在多样性和质量间取得平衡

0.9 ~ 0.95 — 允许更多低概率词 · 创意性更强，偶尔会跑偏

1.0 — 不做截断，等价于关闭 · 不推荐，可能采样到无意义词

优势： 比 Temperature 更"智能"——当模型很确定时自动收窄，不确定时自动放宽。

💡 使用建议

通用原则

需要精确、低风险 → 低 temperature（0.1~0.3）+ 低 top-p（0.1~0.5）
需要创意、多样性 → 高 temperature（0.8~1.2）+ 高 top-p（0.9~1.0）
平衡模式（多数日常对话）→ temperature 0.7~0.8，top-p 0.9

常见场景推荐

任务类型	temperature	top-p	说明
代码生成、数学解题	0.1~0.3	0.1~0.3	需要确定性高
事实问答、摘要	0.3~0.5	0.5~0.7	允许少量变化
通用客服/聊天	0.6~0.8	0.8~0.9	平衡流畅与多样性
故事/诗歌创作	0.8~1.2	0.9~1.0	鼓励惊喜
头脑风暴/创意构思	1.0~1.4	1.0	最大自由度，注意偶尔乱码

通用默认配置

temperature = 0.7
top_p = 0.9

这是大多数 API 的默认值，适合 80% 的场景

⚠️ 注意事项

不要同时设极值：T=0 + top_p=0.1 会导致输出极度单调
Temperature 优先调：多数情况下调 T 就够了，Top_p 保持 0.9 不动
需要确定性时用 T=0：此时 Top_p 失效（贪婪解码优先）
不同模型敏感度不同：同样参数在不同模型上效果可能差异较大
batch 生成时注意：同一 prompt 多次调用，参数相同也会得到不同结果

🔑 快速记忆

Temperature → "敢不敢冒险"：越低越保守，越高越大胆
Top_p → "备选池多大"：越低选择越少，越高越自由
两者配合 → T 定基调，Top_p 做微调

接触可卡因及其主要代谢产物的鲑鱼活动范围更广

Hacker News 热门

1659447091

2026年4月21日 23:56

Salmon exposed to cocaine and its main byproduct roam more widely (www.science.org)