【转载】一文看懂“提示词” vs “提示词工程” vs “上下文工程” Anjhon’s Blog 2025年7月5日 00:00 一文看懂“提示词” vs “提示词工程” vs “上下文工程” 很多人分不清楚什么是“提示词”(Prompt),什么是“提示词工程”(Prompt Engineering),现在还又多了一个概念叫“上下文工程”(Context Engineering),这又和“提示词工程”什么区别?
LLaMAFactory 微调实战 Anjhon’s Blog 2025年7月2日 00:00 LLaMA Factory 是一个简单易用且高效的大型语言模型(Large Language Model)训练与微调平台。通过 LLaMA Factory,可以在无需编写任何代码的前提下,在本地完成上百种预训练模型的微调
消费主义陷阱 Anjhon’s Blog 2025年6月20日 00:00 有一种消费主义陷阱,非常难以察觉,因为它的诱饵不是别的,而是“用消费代替你本该付出的”,然后,你就轻轻松松地成功了。过度消费、玩乐不仅买不到快乐,还会让你失去部分快乐的能力。
【小记】分布式训练中进程崩溃 SIGSEGV Anjhon’s Blog 2025年6月17日 00:00 torch.multiprocessing.spawn.ProcessExitedException: process 1 terminated with signal SIGSEGV
【小记】在 Docker 中分布式训练深度学习模型 Anjhon’s Blog 2025年4月18日 00:00 在深度学习训练中,训练方式根据并行策略的不同分为模型并行和数据并行。 在 N 卡上使用 torch 进行数据并行训练时,又有两种不同的选择:torch.nn.DataParallel(DP)、torch.nn.DistributedDataParallel(DDP)。 今天的重点是在 Docker 中使用 torch.nn.DataParallel(DP) 进行单机多卡训练。
【小记】纯手工绘制 Transformer 架构流程图 Anjhon’s Blog 2025年6月15日 00:00 纯手工绘制 Transformer 架构图;Drawing the Transformer architecture diagram by hand
Cloudflare + 自定义域名 + Cursor Free VIP = Cursor Pro Anjhon’s Blog 2025年5月21日 00:00 如果想一直使用真实邮箱,则到期或限额用完后需要去官网注销账号,然后重新注册,这样的可能会被记住机器码,此时使用 Cursor Free VIP 的功能 1:重置机器ID;即可重复使用 如果不想重复注销账号,则可以使用我们上面申请的无限邮箱账号,到期或限额用完后使用新账号,选择功能 2:使用自定义邮箱注册Cursor;会自动注册 Cursor 账号,我们只需要登录即可(从 Cursor 登录时会跳转到网页,此时我们可以使用验证码登录,这样验证码就会发送到我们之前设置好的真实邮箱中了)
MPC 不完全笔记 Anjhon’s Blog 2025年6月20日 00:00 MPC 全称 Model Context Protocol ,是由 Claude 母公司 Anthropic 于 2024 年 11 月提出的一种开放协议,它标准化了应用程序如何向LLMs提供上下文。 MCP 作为一种标准化协议,极大地简化了大语言模型与外部世界的交互方式,使开发者能够以统一的方式为 AI 应用添加各种能力。 MCP 遵循客户端-服务器架构,其中主机应用程序可以连接到多个服务器
Spark SQL Anjhon’s Blog 2024年8月2日 00:00 SparkSQL 是 Spark 的一个模块,专为处理结构化数据而设计,提供了对 SQL 查询的支持,使得用户可以通过 SQL 或 DataFrame API 进行高效的数据处理和分析。SparkSQL 允许无缝地在结构化数据(如 JSON、Parquet、Hive 表)和 RDD 之间进行转换,集成了 Catalyst 优化器和 Tungsten 执行引擎,从而实现查询优化和高效执行。此外,SparkSQL 还支持与多种数据源的集成,使其在大数据处理和分析领域具有广泛的应用。