普通视图
-
Buzzing

- 《Blighty通讯》:如何培养一名英国选民Blighty newsletter: How to build a British voter (www.economist.com)00:59
全球混合动力及电动汽车销量预测
-
安志合的学习博客
- 大模型 Temperature 与 Top_p/Top_k 参数详解这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项🔥 Temperature(温度)作用:控制输出分布的"尖锐度"模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:P'(word) ∝ P(word)^(1/T)Temperature 值 / 效果 / 适用场景T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)本质: 低温度让分布
大模型 Temperature 与 Top_p/Top_k 参数详解
这两个参数都用于控制大模型输出的随机性和多样性,是调整模型行为最重要的超参数,但机制不同。简单理解:
Temperature(温度):控制概率分布的“陡峭”程度,影响整体随机性。
Top-p(也称核采样):限制候选词的累积概率范围,动态过滤掉极不可能的选项
🔥 Temperature(温度)
作用:控制输出分布的"尖锐度"
模型在生成每个 token 时,会先计算所有候选词的概率分布。Temperature 会对这个分布做如下变换:
P'(word) ∝ P(word)^(1/T)
Temperature 值 / 效果 / 适用场景
T = 0(或极低) — 始终选概率最高的词,输出完全确定 · 代码生成、数学计算、需要确定性答案的任务
T = 0.1~0.3 — 高度保守,几乎总是选最优解 · 事实问答、信息抽取、严格格式输出
T = 0.5~0.7 — 平衡随机性,主流默认值 · 通用对话、写作辅助、大多数场景
T = 0.8~1.0 — 明显增加多样性 · 创意写作、头脑风暴、角色扮演
T > 1.0 — 高度随机,可能产生无意义内容 · 艺术创作、探索性实验(不推荐日常使用)
本质: 低温度让分布更"尖锐",高温度让分布更"平缓"。
🎯 Top_p(Nucleus Sampling / 核采样)
作用:动态截断低概率词
与 Temperature 固定缩放不同,Top_p 按概率从高到低累加,直到累计概率达到 p 值,只保留这些词,从保留的这些词中采样:
例如 top_p=0.9: 选词 A(40%) + B(30%) + C(20%) = 90% → 保留 词 D(10%) 被截断
Top_p 值 / 效果 / 特点
0.1 ~ 0.3 — 极度保守,只选最高概率词 · 类似低 temperature,但更动态
0.7 ~ 0.9 — 主流推荐值 · 在多样性和质量间取得平衡
0.9 ~ 0.95 — 允许更多低概率词 · 创意性更强,偶尔会跑偏
1.0 — 不做截断,等价于关闭 · 不推荐,可能采样到无意义词
优势: 比 Temperature 更"智能"——当模型很确定时自动收窄,不确定时自动放宽。
💡 使用建议
通用原则
需要精确、低风险 → 低 temperature(0.1~0.3)+ 低 top-p(0.1~0.5)
需要创意、多样性 → 高 temperature(0.8~1.2)+ 高 top-p(0.9~1.0)
平衡模式(多数日常对话)→ temperature 0.7~0.8,top-p 0.9
常见场景推荐
任务类型 temperature top-p 说明 代码生成、数学解题 0.1~0.3 0.1~0.3 需要确定性高 事实问答、摘要 0.3~0.5 0.5~0.7 允许少量变化 通用客服/聊天 0.6~0.8 0.8~0.9 平衡流畅与多样性 故事/诗歌创作 0.8~1.2 0.9~1.0 鼓励惊喜 头脑风暴/创意构思 1.0~1.4 1.0 最大自由度,注意偶尔乱码
通用默认配置
temperature = 0.7 top_p = 0.9
这是大多数 API 的默认值,适合 80% 的场景
⚠️ 注意事项
不要同时设极值:T=0 + top_p=0.1 会导致输出极度单调
Temperature 优先调:多数情况下调 T 就够了,Top_p 保持 0.9 不动
需要确定性时用 T=0:此时 Top_p 失效(贪婪解码优先)
不同模型敏感度不同:同样参数在不同模型上效果可能差异较大
batch 生成时注意:同一 prompt 多次调用,参数相同也会得到不同结果
🔑 快速记忆
Temperature → "敢不敢冒险":越低越保守,越高越大胆
Top_p → "备选池多大":越低选择越少,越高越自由
两者配合 → T 定基调,Top_p 做微调
-
Hacker News 热门
- 接触可卡因及其主要代谢产物的鲑鱼活动范围更广Salmon exposed to cocaine and its main byproduct roam more widely (www.science.org)04-21 ↑ 100 HN Points
接触可卡因及其主要代谢产物的鲑鱼活动范围更广
蒂姆·库克的绝佳时机
-
Hacker News 热门

- 游戏业先驱路易斯·佐奇去世Louis Zocchi, games industry pioneer, has died (icv2.com)04-21 ↑ 101 HN Points
游戏业先驱路易斯·佐奇去世
-
Hacker News 热门

- Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件VidStudio, a browser based video editor that doesn''t upload your files (vidstudio.app)04-21 ↑ 108 HN Points #Show HN
Show HN: VidStudio 是一款基于浏览器的视频编辑器,无需上传文件
-
Hacker News 热门

- 苹果无视关于DMA互操作性的请求,且与自身文档相矛盾Apple ignores DMA interoperability requests and contradicts own documentation (fsfe.org)04-21 ↑ 108 HN Points
苹果无视关于DMA互操作性的请求,且与自身文档相矛盾
-
Hacker News 热门
- Show HN: Mediator.ai – 利用纳什讨价还价和大型语言模型实现公平机制的系统化Mediator.ai – Using Nash bargaining and LLMs to systematize fairness (mediator.ai)04-20 ↑ 101 HN Points #Show HN
Show HN: Mediator.ai – 利用纳什讨价还价和大型语言模型实现公平机制的系统化
-
Hacker News 热门

- 软件工程法则Laws of Software Engineering (lawsofsoftwareengineering.com)04-21 ↑ 110 HN Points
软件工程法则
-
Hacker News 热门
- MNT Reform 是一款开放式硬件笔记本电脑,由德国设计并组装MNT Reform is an open hardware laptop, designed and assembled in Germany (mnt.stanleylieber.com)04-20 ↑ 104 HN Points
MNT Reform 是一款开放式硬件笔记本电脑,由德国设计并组装
-
土法炼钢兴趣小组的博客
- 【可观测性工程】OpenTelemetry 深入:SDK、Collector、语义约定与版本演进从 OpenTracing 与 OpenCensus 合并到今天的 OTel v1 稳定版,梳理 SDK 生命周期、Collector 流水线、OTLP 协议与 Semantic Conventions 的工程意义,并结合阿里 ARMS、观测云、夜莺等国内实践,给出多租户与尾采样的落地建议。
【可观测性工程】OpenTelemetry 深入:SDK、Collector、语义约定与版本演进
-
土法炼钢兴趣小组的博客
- 【开源许可与版权工程】开源世界全景:从 GNU 到大模型的四十年一篇写给中国工程团队的开源世界地图:从 1983 年 Richard Stallman 发起 GNU 项目、1998 年 OSI 成立、2018 年 MongoDB 更改 SSPL,到 2020 年开放原子开源基金会成立、再到 2024 年大模型时代的 OpenRAIL 与 LLaMA 许可,把四十年的关键事件、基金会、协议演进和中国线索串成一张可直接指导选型的全景图。
【开源许可与版权工程】开源世界全景:从 GNU 到大模型的四十年
-
Buzzing
- 习近平呼吁重开霍尔木兹海峡,中国在平衡其海湾利益Xi Calls For Hormuz to Reopen as China Balances Its Gulf Interests (nyti.ms)04-21
习近平呼吁重开霍尔木兹海峡,中国在平衡其海湾利益
-
谷歌全球新闻
- 亲克里姆林宫的前总统鲁门·拉德夫在保加利亚大选中取得压倒性胜利 - NBC NewsKremlin-friendly ex-president Rumen Radev scores big election win in Bulgaria (news.google.com)04-21 #NBC News
亲克里姆林宫的前总统鲁门·拉德夫在保加利亚大选中取得压倒性胜利 - NBC News
-
精品MAC应用分享

- DaVinci Resolve Studio 21.0 Beta 1 Mac顶级调色软件应用介绍 DaVinci Resolve Studio调色系统突破传统理念,摆脱单机性能不足的瓶颈,是最先进计算机集群技术和GPU运算技术的相结合,因此调色过程具有最高的实时性,即使客户提出各种苛刻要。 DaVinci Resolve Studio是世界最受欢迎的高端DI调色系统,其强大特性正在被好莱坞和世界各地的高端后期制作机构广泛使用。现在DaVinci Resolve Studio推出了Mac OS X版,因此创作人员们也可以在他们喜爱的平台上使用DaVinci Resolve Studio的高端特性了。 DaVinci Resolve Studio现在有了一个新的用户界面,可提供快速、简单和直观的创作工具,不像其他调色系统那样由于界面繁杂而难以使用。DaVinci Resolve Studio的与众不同之处在于,它是根据调色师们的需求以及他们数十年来积累的调色经验而开发的。 新的Mac版DaVinci Resolve Studio现在不需要转换就可以直接在时间线上读写所有常见的Apple ProRes文件格式,包括4444、422、422(HQ)、422(Proxy)和422(
DaVinci Resolve Studio 21.0 Beta 1 Mac顶级调色软件
![]()
应用介绍
DaVinci Resolve Studio调色系统突破传统理念,摆脱单机性能不足的瓶颈,是最先进计算机集群技术和GPU运算技术的相结合,因此调色过程具有最高的实时性,即使客户提出各种苛刻要。
DaVinci Resolve Studio是世界最受欢迎的高端DI调色系统,其强大特性正在被好莱坞和世界各地的高端后期制作机构广泛使用。现在DaVinci Resolve Studio推出了Mac OS X版,因此创作人员们也可以在他们喜爱的平台上使用DaVinci Resolve Studio的高端特性了。
DaVinci Resolve Studio现在有了一个新的用户界面,可提供快速、简单和直观的创作工具,不像其他调色系统那样由于界面繁杂而难以使用。DaVinci Resolve Studio的与众不同之处在于,它是根据调色师们的需求以及他们数十年来积累的调色经验而开发的。
新的Mac版DaVinci Resolve Studio现在不需要转换就可以直接在时间线上读写所有常见的Apple ProRes文件格式,包括4444、422、422(HQ)、422(Proxy)和422(LT)。调色师们可以在他们的素材存储上选取素材片段,然后用DaVinci Resolve实时播放和调色,即使时间线上的素材是不同的分辨率和格式也没有问题。
更新日志
激活方法
直接安装
-
Buzzing
- 独家:消息人士称,SpaceX本周将举办为期三天的分析师会议以争取华尔街支持Exclusive: SpaceX to woo Wall Street with three-day analyst meet this week, sources say (reut.rs)15:35
独家:消息人士称,SpaceX本周将举办为期三天的分析师会议以争取华尔街支持
-
Buzzing
- 中国“胜利巨人”在香港上市首日大涨60%,此前完成26亿美元募资China''s Victory Giant jumps 60% in Hong Kong debut after 2.6 billion offering (reut.rs)14:35
中国“胜利巨人”在香港上市首日大涨60%,此前完成26亿美元募资
-
Buzzing
- 金价下跌,因投资者等待美伊谈判的明确消息;美元小幅走高Gold falls as investors await clarity on US-Iran talks, dollar edges up (reut.rs)14:30
