普通视图

发现新文章，点击刷新页面。

昨天以前蟹壳

蟹壳
如何逃顶shellc
疯牛最重要的是两点，满仓抄底，精准逃顶。疯牛最重要的是两点，满仓抄底，精准逃顶。这两点都几乎不可能做到。原因是事实无法确认。一轮牛熊过后，回头看起点和顶点非常清晰。当时当下，却无法辨认，起点可能是无尽的深渊，顶点也可能是半山腰。价格是由市场决定的，而市场本身是人的情绪。人的情绪像做布朗运动的微观粒子，运动是随机的，不过粒子的运动依然要受物理定律的约束，总会限制在一定的范围内。股票的价格也类似，不会贱入尘埃，也不会冲破天际。价格总是要锚定在一种价值上，但是价格又永远不会准确反映价值。所以，我们不能准确量化价值，却能描绘价格围绕价值运行的区间。可以用两种思路来确定价格范围，一是它曾经出现在哪里，二是引力是多大。我用沪深 300 指数估值来确定整个市场的运行范围。PEPB 指标通过历史统计获得，指示价格区间。风险溢价指标通过无风险利率和指数估值拟合成价值引力。从 A 股历次牛熊来检验，PEPB、风险溢价的极值是一种非常不错的抄底和逃顶的参考指标。当前 PEPB 值70，风险溢价37.5，正在从极端低估向合理位置运动，远没到疯狂。现代市场还面临着一个具有决定
2024年10月8日 08:00

如何逃顶

蟹壳

作者 shellc

2024年10月8日 08:00

疯牛最重要的是两点，满仓抄底，精准逃顶。

疯牛最重要的是两点，满仓抄底，精准逃顶。这两点都几乎不可能做到。原因是事实无法确认。一轮牛熊过后，回头看起点和顶点非常清晰。当时当下，却无法辨认，起点可能是无尽的深渊，顶点也可能是半山腰。

价格是由市场决定的，而市场本身是人的情绪。人的情绪像做布朗运动的微观粒子，运动是随机的，不过粒子的运动依然要受物理定律的约束，总会限制在一定的范围内。

股票的价格也类似，不会贱入尘埃，也不会冲破天际。价格总是要锚定在一种价值上，但是价格又永远不会准确反映价值。所以，我们不能准确量化价值，却能描绘价格围绕价值运行的区间。

可以用两种思路来确定价格范围，一是它曾经出现在哪里，二是引力是多大。

我用沪深 300 指数估值来确定整个市场的运行范围。PEPB 指标通过历史统计获得，指示价格区间。风险溢价指标通过无风险利率和指数估值拟合成价值引力。从 A 股历次牛熊来检验，PEPB、风险溢价的极值是一种非常不错的抄底和逃顶的参考指标。

当前 PEPB 值70，风险溢价37.5，正在从极端低估向合理位置运动，远没到疯狂。

现代市场还面临着一个具有决定性影响力的力量，这就是政策制定者，他们会锚定宏观经济指标来操纵市场。比如 CPI、PPI、PMI。经济差的时候，他们总是倾向于呵护市场，经济过热的时候他们会打压市场。所以，不要忤逆这种强权。

CPI

当前的 CPI 和 PPI 都处于低位，正是消费和生产都面临困境的时候，政策也刚开始对市场进行过分的呵护。当两者走强，就要小心它反手一个大耳刮子扇过来了。也要小心它不可预期地发疯，像一个家暴男。

我争取每周更新这两张图，时刻提醒自己接下来最重要的任务是逃顶。

我的持仓和策略

蟹壳

作者 shellc

2024年10月7日 08:00

为了不对关注本公众号的朋友造成意外的影响，我需要交代一下我的持仓和整体策略。

这个公众号主要用于有一搭没一搭地更新我个人的一些胡思乱想，也会更新一些关于市场的实时的想法，很多想法和我个人的持仓及策略紧密相关，用来指导其他账户的操作可能会产生严重后果。这个号的关注人数并不多，但是为了不对这些朋友造成意外的影响，我还是需要交代一下我的持仓和整体策略。

我的长期风格是偏价值投资，价值投资并不是一个有精确定义的概念，以下几点可以概括基本思路：

1）安全边际：以基本可量化的方式评估预期收益，以极高的预期收益作为安全边际，大部分时候会命中因宏观或周期导致的低估标的，极少情况会考虑高增长

2）分散：以 10～20 只标的分散，提高容错性，可接受 3～5 只同时出现 50% 亏损

3）现金流：持仓整体股息率要超过十年期国债，熊市以股息率为锚

4）充分利用市场泡沫：市场低迷时超配股票，市场疯狂时逐步退出，小仓位追踪市场情绪

目前的持仓统计如下：

股票仓位 73%，主要分布于 A 股(30%)、恒科个股(17%)、中概个股(18%)、其他短期打野小仓位。19.1% 的美短中债，资金主要来源于 5 月份减仓的美股。

当前持仓的整体股息率：2.74%。

接下来的中长期策略：

1）主要仓位不变，如果中国资产泡沫化继续，则逐步调整仓位到低估高股息

2）跟踪研究全市场高股息股票，可能是一些能源和公用事业

3）不增加美国资产仓位，除非大幅回调，择机配置标普 500 ETF 和超配部分成分股，目前持仓 3.5% 标普 500 ETF

4）利用不超过 5% 仓位捕捉市场情绪，参与赔率足够高的机会

如果市场继续疯狂，大部分更新中提到的标的可能都是我的小仓位打野，总体持仓不会超过 5%。比如节前提到的港股中资券商和低估中概。目前港股券商已清仓，9 月 30 日～10 月 3 日捕获一倍收益，美股中概和恒科目前还在持仓中，已有20～50%收益，暂时继续持有。

主仓没有大的变化，会小幅（不超过 3%）择机增加创业板 50 ETF，提高弹性。

超短期：

1）继续持有中概、恒科、超配有瑕疵的互联网公司估值修复后清仓

2）打野仓位不参与半导体炒作，不参与主题炒作，只关注高确定性的修复机会

3）如果市场回调，不管什么幅度，均躺平装死

4）周二 A 股集合竞价追加 1% 创业板 50 ETF

如果你目前空仓，不具备研究能力，看好这轮行情并接受 20% 回撤，我的建议：

1）计算好准备参与的资金量，以 2～3 年不需要用的钱为主，不加杠杆不借钱

2）周二集合竞价一次性买入，不要等回调，不要采用添油战术越高越买

3）后面绝对不增加仓位

4）不要买基金，不要买行业 ETF，只买沪深 300、创业板 ETF等指数

本轮行情的不确定性高于以往，目前的推动因素主要是货币政策和接下来的财政政策。宏观经济不确定性依然很高，外围风险和不确定性持续增加中。

股市有风险，投资需谨慎。

腾讯阿里的伯克希尔哈撒韦时刻

蟹壳

作者 shellc

2024年10月6日 08:00

腾讯 1500 元，BABA 回 300 美元

腾讯和阿里是中国互联网的两头巨无霸。从 2014 年左右开始，伴随着无线互联网、O2O 等热潮，手握大量资本的两家公司，在投资领域纵横捭阖。阿里提出了新零售在内的“五新”，开始整合线下商超，腾讯密集投资了京东、美团、拼多多等多家头部互联网公司。

两家公司一时成了全民焦点，不但是名校毕业生的就业首选，连大妈们都想去大厂抢个女婿。然而，两家公司的高光时刻在 2020 年底戛然而止。

2020 年底，最高层首次明确提出“强化反垄断和防止资本无序扩张”。随后两年多，在社交媒体上，两家公司差不多成了全民公敌。股价也开启了漫长的下跌。2021 年 2 月腾讯股价 775.5 港元，2022 年 10 月创下198 元的低点，跌幅 74%。2020年 10 月 BABA 319 美元，2022 年 10 月创下 58 元的最低，跌幅 81.8%。

两家公司股价的趋势性反转发生在 2024 年初。截止目前（2024.10.06）本年（2024）涨幅均超过 50%，但依然远低于历史高点。

股价反转的原因有三条：1）监管态度转向，从严厉的打击资本无序扩张转变成鼓励平台经济；2）公司主动开启分红、回购，股东回报大幅增加；3）降本增效和回归主业，盈利能力持续提升。

监管基本是 180 度转向，但事实上却又达到了预期的监管效果。投资者消除了“铁拳”恐惧，政策可预期性增强。所以监管影响一个比较长的时期内应该不用考虑了。

两家公司的股票回购力度非常惊人，阿里 2024 年前 6 个月，回购金额达 106 亿，假设全年回购 200 亿，以 2700 亿市值计算，回报率已达到 7.4%。

腾讯 2024 年上半年回购金额 523 亿港元，以当前市值计算，回报率大概 2.3%。腾讯的回购已经进行了三年多。

从滚动 PE 来看，目前两家的估值算合理，BABA 甚至低估。如果计入未来市场热度提高带来的估值提升，两家股价依然有较大的增长空间。

两家公司为什么要如此大规模的回购？一个合理的猜测是和“防止资本无序扩张”后果有关。两家之所以会有无序扩张的行为，根本原因是主业太赚钱了，而主业本身又不需要新资本投入，所以只能把赚来的钱投别的公司，形成了混乱无序的资本扩张现象。当投资被抑制，就只能进行现金回报。所以这两家公司，已经成为事实上的现金奶牛。

新赚的钱没法投资了，只能通过分红回购的方式回报股东。那么之前已经无序扩张的部分呢？这部分并没有被市场合理定价。这里可能隐藏着一个巨大的投资机会。

BABA 目前市值2706 亿美元。现金及现金等价物 2481 亿人民币，还能维持高额回购很久。投资分两部分，一部分是权益法核算的投资 2031 亿，一部分是股权证券投资 2808 亿。

腾讯市值 4 万亿港币，现金及现金等价物 1535 亿，依然可以维持高额回购，以公允价值计量的投资 4700 亿。

试想一个场景，如果接下来市场进入牛市，两家公司的股权投资会发生什么？以两家公司的股权投资和净利润比值看，两家公司在牛市中的净利润很可能翻几倍。一个反身性过程就会发生，牛市导致股价上涨，股权投资带来盈利大涨，进一步导致股价上涨。

腾讯的投资中包含更多上市公司股权，利润弹性会更大，极端情况下可能出现盈利十倍的增长。结合估值提升，未来腾讯股价超越 2021 年高点是大概率事件，而且可能超过高点几倍的价格。1500 港元的腾讯是可能出现的。

BABA 的资产质量比腾讯差很多，但是在同样的逻辑下，依然有机会回到前期高点。

两家公司的策略已经很明显：降本增效维持主业高盈利；精挑细选具备战略性的投资；择机减少前期无序扩张的投资；回收现金大比例回购。这个过程走到最后，大家会发现，两家公司会成为非常赚钱的生意，市场可能也愿意长期维持高估值。

伯克希尔哈撒韦就是一家股权投资公司，而当下就是腾讯阿里的伯克希尔哈撒韦时刻。我们将享受一个股权价值高涨最后被清算给股东的过程。Enjoy it！

A 股在新的起点

蟹壳

作者 shellc

2024年9月29日 08:00

希望这是一个美好新时代的开始

本周上证指数涨12.81%、沪深 300 涨15.7%，创业板指涨 22.71%，几乎全是光头光脚大阳线。这种盛况至少得是十年前入市的老股民才有过亲身经历。

本轮暴涨开始前，指数已经连跌五个月，连续四年负收益，主要指数全部几乎接近 2021 年以来最低点，全市场处在一种末日氛围中，对现实世界的一切都开始充满怀疑。

转折点发生在 9 月 24 日上午，国新办发布会罕见地在股市开盘前举行，人行、金监总局和证监会一把手出席，阵容和时点尤为特殊。

9 月 24 日公布的主要政策有三项：1）降低存款准备金率和政策利率；2）降低存量房贷利率，统一房贷最低首付比例等房地产政策；3）创设两项合计 8000 亿元额度的心货币政策工具，支持股票市场稳定发展。新闻发布会结束时有记者追问关于平准基金的情况，潘行长表示正在研究。

新闻发布会途中市场开始犹豫上涨，直到宣布重磅政策后市场开始疯狂，上涨综指午后大涨超过 4%。25 日收十字，市场对新政策存在分歧。

随后 26 日中央政治局会议定调经济政策，传递的信号是高层正视当前问题并给出“加力推出增量政策”的预期，股市彻底被点燃。

港、美股外资市场上的中国资产同步上涨，甚至热度更高。MCHI周涨 19.53%，FXI 周涨 18.9%，KWEB 周涨26.79%，阿里巴巴周涨21.57%，腾讯控股周涨12.66%。

本周的两场会议是具有巨大影响力的事件，多年后可能依然会被提及。不仅因为这极有可能是新一轮行情的起点，也有可能是一些影响深远的制度创新时刻。此时此刻，一些新的设想需要被记录以备持续演绎。

1）政策是一种现实扭曲力量

当下的市场处于一种被政策扭曲的状态，理性讨论经济前景的声音一旦成为主流，市场向下修复可能不可避免。政策推出前的市场充分反应了经济的低迷现实和悲观前景，政策推出后的上涨是对政策超预期的反应，不是对未来经济前景的反应。简单来说，当下的市场热情是对权势部门关爱的条件反射式回应，当市场重新开始关注经济问题时，市场可能会被重新定价。

政策的这种力量将伴随市场，直到经济回升。所以，市场回调不会超过2 月份的低点，全年应该收涨。9 月份经济数据可能非常差，10月后半段可能是第一个冷却点。四季度是政策的发力时间，可能一些宏观指标会逐渐变好，市场会在高歌猛进中迎接新年。如果宏观数据仍不及预期，市场可能就要波动几个月，看一季度的情况了。未来无非两种可能，经济走出困境或万劫不复。摒弃舆论干扰，要相信经济肯定会走出困境。黑天鹅事件导致的未来崩塌不在讨论之列。

未来几个月经济回升的过程中，新政策的发布可能会不及市场预期，但已发布政策的执行情况需要重点关注，这里潜伏着交易机会。

2）高股息

高股息特指这一年多以银行为代表的破净、高股息率国有资产。924 之前，这类股票的逻辑是交易经济衰退，高股息率国有资产意味着低风险收益。924 之后，新货币政策工具鼓励贷款回购，市场开始交易破净股的市净率修复。

银行是中国金融的核心，房地产的熄火给银行带来了很大的风险，坏账、提前还贷、利率下行都会给银行经营带来压力。银行是百业之母，负债率和净息差限制了创造信用的能力。充足银行资本以扩大资产负债表规模可能是政策的真正意图。银行股增发向社会融资需要避免国有资产流失，所以必须提高银行股市净率。

交易破净银行股提升估值这个逻辑是成立的，但是如果考虑当下很多高质量龙头都在低位，高股息交易的机成本较高，交易可能就不划算了。银行股多年破净是有原因的，估值拉高后长期持有未必没有风险。

另一类高股息是公用事业股，924 之后这些股票可能会因为向上的弹性不够被冷落。买回他们的时机是等它们被彻底打入冷宫后，作为长期底层资产配置，以迎接下一个周期。

上面讨论的高股息是市场定义的高股息，其实经过近五个月的下跌，很多大白马的股息率甚至更高。同时兼具成长性、高质量的特点，会成为牛市中被抢夺的筹码。如果预期未来是大牛市，高股息大白马显然比高股息银行有吸引力得多。还有一点，很多大白马其实也是国资，是各地国资委的亲儿子，新的政策工具它们获益一点不少。

3）A 股高回报时代

A 股市场一直被诟病是融资市场，股东回报不足，参与者把股市当赌场，玩互相掏兜的游戏。问题是，过去真的有人在乎股票的分红、回购这类回报吗？

散户、游资绝大部分不在乎，股市就是一个炒概念追热点相互掏兜的游戏。机构投资者也不在乎，赶上行情好就拼命做规模，赚管理费。大股东国资也不在乎，股市过去的使命是为经济发展和创新提供融资退出渠道，财政暂时还不需要国有上市公司提供回报。

别看过去游资、机构很活跃，这个市场里真正有影响力的是国资大股东，当经济的底层逻辑发生变化以后，财政政策也会发生，未来国资必须为财政提供更多回报。如果这个推论被证实，A 股会出现根本性的变化。

回报从何而来呢？一方面肯定是持续稳定的经营利润带来的分红，另一个方面就是盘活资产。观察美国公司会发现，很多公司的负债率超高，比如苹果，负债率长期处于 80% 以上。而 A 股的茅台，负债率只有 20%。苹果的负债率主要来自于利用负债进行股票回购，这个操作的本质是把资产变成负债，股东的持股比例持续提高，同时 ROE 提升，商业模式变成轻资产，估值获得提升。当然，美股还有一个很重要的原因是税收考虑。

茅台也可以复制这个过程。茅台的负债率提高到 80% 的情况下，当前总资产 2792 亿，就可以获得 1721.6 亿的资金。当前市值 2.05 万亿，这个资金通过回购的方式减少股本，就可以让全体股东的持股比例提高 9%。贵州国资委可以转手卖掉 9% 的股票，然后他的持股比例又回到了回购之前。当然，这是个简化的过程，这个过程可以用几年时间陆续完成，也可以配合市值管理动态地增减持。这个过程可以一直持续做。

换一个角度，互换便利和回购再贷款其实是一种量化的货币发行工具，锚定国有上市公司的股权。这种工具在拥有强势政府的国家其威力和准确性会远远大于美国。

作为普通投资者，应该把风险和利益和财政部对齐。具有良好经营业绩且负债率较低的国资大白马可能会走出长期稳定的行情。当然行长也特意强调了，这个贷款对国资民企一视同仁。

4）美股

中概互联网公司某种角度来说是中国治理能力最强的一批公司。回购这个操作阿里和腾讯已经玩了一年多了，腾讯的回购周期甚至是以天为单位的，每周进行几次回购。所以这些公司的股价其实已经早于 A 股上涨。今年腾讯已经涨50%，阿里巴巴涨41.5%。中概大部分公司目前的估值只能算合理，已难说便宜，接下来如果有泡沫化过程会是个机会。个别有瑕疵的中概还具备很高的赔率，值得一博。

标普 500 和纳斯达克 100 的估值已经非常高，市场在赌 EPS 可以持续增长，只要增长不满足预期，将会非常残暴。君子不立危墙之下。

美短债非常值得配置，超短有 5% 以上的收益，长一点的有 3% 以上。10 年以上长债看着不错，但是也要小心，长债的波动性远大于短债，而且一旦趋势反了，周期可能会非常长。

美股的总体逻辑是持现金、短债等大幅回撤。

5）下周

下周国内国庆节长假，港股只有周一放假，美股交易不受影响。如果热度不减，下周重点关注港股高股息低 PE 中资券商。

希望这是一个美好新时代的开始。

谁是主力

蟹壳

作者 shellc

2024年8月10日 08:00

1990 年代宝总和麒麟会的传说，深刻在股民的语言系统里。岂不知，真正的主力其实就在身边。

公募基金份额

有一种神秘人，大家都听过，但是从来没见过，比如”主力“。主力拉升、主力出货，主力在暗处密谋，呼风唤雨。1990 年代宝总和麒麟会的传说，深刻在股民的语言系统里。岂不知，真正的主力其实就在身边。

市场，有的时候谁有钱谁说了算，有的时候谁有货谁说了算。2020 年至今的市场，基民说了算。基民是群众，是汪洋大海。

但是，群众不能决定的历史的走向，决定历史的是客观规律，群众被乱世枭雄蛊惑、利用，把历史推向波澜壮阔。

基民也不能决定市场的走向，但是他们把钱给基金经理，让市场走向疯狂和毁灭。基金经理是基民的魔鬼代言人。

基民出现在每一个重大事件的节点。他们抱团、他们交易衰退和复苏，他们听着市场的鬼故事申购和赎回。

他们看着爱基的净值感到绝望，他们对基金经理的爱慢慢变成了恨。

他们从一个极端走向了另一个极端。其实希望已经在他们的绝望中孕育。

他们低头看脚下的路永远是对的，抬头看远处的目标永远是错的。

抱团核心资产、抱团高股息、抱团债券，当共识成为共识的时候，他们已经华丽转身成了金融消费者。

听央妈的话吧，别让他受伤。天使的魔法，温暖中慈祥。

你问央妈让你干吗？她说不许买债券了！爷爷听见妈妈的话，说对，你有点出息吧，别盯着那三瓜俩枣了！没看隔壁小日子都要抢跑了吗，等我缓过这口气来，把你们都埋了。

开源大模型与闭源大模型哪个更好？

蟹壳

作者 shellc

2024年4月20日 08:00

开源模型和闭源模型，哪个更好呢？这个问题其实非常 LOW 。

开源大语言模型与闭源大语言模型，哪个更好？虽然有很多 benchmark，但是评价一个大语言模型的好坏并没有非常客观的标准，因为 LLM 要解决的目标问题被分解成了几十个，对应的评测数据集和方法也多达几十个，很难用一个算法来客观评价一个 LLM 的效果比另个好或者坏多少。不过也不是完全没有比较，使用更多人关注的 benckmark 和主观打分来评判，头部模型的排名也确实有个相对的共识。比如，GPT-4 系列，目前依然是公认的效果最优的模型。

那么开源模型和闭源模型，哪个更好呢？这个问题其实非常 LOW 。因为根本没办法从开源和闭源这个属性去推导影响模型质量的因素。抛出这个问题的人，要么是刻意去误导他想影响的人，要么就是瞎扯淡。

如果非得要个结论，可以说目前最好的模型是闭源的，但是模型的好坏和闭源还是开源无关。开源也有很多非常优秀的模型，闭源也有很多垃圾。

为什么有的模型要选择开源呢？

这里要稍微解释一下，模型的开源和软件的开源还不一样。模型的开源，大多是说开源了模型的权重，也就是训练结果，并不一定开放代码、数据集和网络架构、训练方法。简单来说，开源模型是提供了一个可以免费部署的 LLM。虽然，通过 fine-tune 也可以添加一点自己的数据改变一些它的行为，但是你可能没办法像开源软件一样从零 build 这个模型。另外，开源模型的商业使用可能是需要特殊授权的。

开源模型大多只是提供一个可以免费有限使用和评估的 LLM。这么做的目的是什么呢？怎么这么多赛博菩萨呢，这必须来分析开源模型背后的动机。

LLM 的火爆是因为 OpenAI 推出的 ChatGPT，从 OpenAI 的角度考虑，手握一个最优秀的模型，肯定是考虑使用这个新变量怎么颠覆现有商业格局的。所以它不会开源，未来有另一个模型超越了 OpenAI 最好的模型的话，这个模型也不会选择开源。

从开源模型的视角来看，比如 Meta 和 Google，如果放任 OpenAI 借助 GPT 系列吸引大量的用户和资金的话，这一定是很大的潜在威胁，谁能保证 OpenAI 不会在社交广告和搜索广告市场搞出颠覆性的事情呢？所以必须遏制 OpenAI 的可能性，推出开源模型，从商业竞争角度就成为一个搅局策略了。虽然开源模型不如 GPT 强，但是提供了一种免费选择，本来必须给 OpenAI 付钱的需求可能就被免费模型满足了，OpenAI 的商业收益就会被影响。更多开源模型的出现，会出现对 OpenAI 的围剿，而且 OpenAI 的领先优势并不是因为某种保密的技术，随着开源模型的优化，OpenAI 的领先会逐渐消失。

亚马逊投资 Anthropic 的逻辑也是一样的，不能让微软联合 OpenAI 在云计算市场搞出颠覆性的事情。

所以大模型的竞争不在于大模型本身，而是现有市场是否可能因为大模型被重塑。没有新技术出现对大型科技企业维持垄断地位是有利的，新的技术因素反而是一种威胁。

开源大模型就是一种主动制造的产能过剩和倾销，破坏领先者的商业利益。

国内的情况很难用这个逻辑来解释，FOMO 情绪可能更多，反正也没有人绝对领先，这又看起来是一个风口，不去抢一下是没道理的。至于开源不开源，其实也没那么重要，因为不开源也不能怎么样。

国内做大模型的企业，“有” 是更重要的。因为我们的甲方来源和决策逻辑是不同的，可控比效果更重要，你值得我相信比你技术更牛13更重要。所以，国内某些企业要花更多精力来操纵甲方心智。

回到开源模型和闭源模型哪个更好的问题。如果只从效果来说，目前最好的模型是闭源的。不是因为闭源所以好，而是因为好所以闭源。不要搞错了这个关系。但是评价模型好坏的标准太多了，某些模型的好只是一种主观上的认同。

经济性也是一个很重要的指标，如果在某类问题上，一个 70B 的模型能够达到 400B 模型效果的 70%。你说那个模型更好呢？为了拼“效果”，很多闭源模型的经济性可能很难有优势。随着时间的推移，开源模型肯定会缩小和闭源模型的差距，未来算力和模型都不会是稀缺的。

当下时点，模型开源依然有很大的社会意义，某个角度说，这也算是一种技术平权。对于开发者和小企业来说，应该永远欢迎新技术，因为只有新技术才会带来可能的创新。开源模型和成熟的基础设施可以让小团队快速交付新的解决方案。这就又回到了和之前互联网、 mobile 类似的情况，创新、风投和收购的良性循环才能给更多人带来机会。所以，个人和小团队应该欢迎 LLM 开源。

关于 AI 的阶段性思考

蟹壳

作者 shellc

2024年3月31日 08:00

AI 短期内不能提供原创性想法，它不可能成为一个创造新理论和新发明的机器。它不会是人类的阿兰图灵。但是它可以非常高效地按照人的意图编写软件，我们这个世界会有无限量的 Jeff Dean 和 Linus Torvalds 供应。

感谢常老板提供的环境，让我最近四个月基于 LLM 搞了一些小玩具。在感受到这波 AI 浪潮的同时，又陷入一种没有方向感的困惑，这玩意到底能干什么。

现在流行讲第一性原理，凡事从最坚实的起点开始。解决这个困惑的起点，从定义目的开始。

对于 AI 的兴奋，是因为觉得可能可以做点什么。AI 能做什么呢？人工智能是一个很长期的计算机科学的叙事，长达80多年了吧。每一次计算机技术的进步都会导致人们对于人造智能的惊叹和不切实际的期待。有一种态度是我认可的，就是你不要太高估 AI 的短期影响，但是不能低估它的长期影响。从长期来看，AI 一定会改变人类的各个场景。但是短期内，要提防各种宏大的科幻叙事。

AGI 就不是一个很好的词，Agent 也不是，甚至 AI 本身都不是。这些词更像是一种营销叙事，不精确，充满想象空间。

我更喜欢把 AI 当成一种软件实现方法。它是一些机器学习算法的集合。是计算机技术的天然的一部分，一个持续地发展的技术领域中的一个分支。

计算机解决的是什么问题？一种计算机器，通过数理逻辑来驱动物理世界的自动化。AI 算法，是为了更高效地驱动某些计算任务的自动化。AI 的根本目的就是计算自动化本身。

当下的 AI 更多被称为 AIGC，这是另一个营销词语。当文字处理软件和计算机图形软件出现的时候，它们对当时的内容生产行业的意义，肯定比今天的 AIGC 要大。在 AI 不能提供原创性想法之前，它依然是计算机技术在内容生产这个领域的量的优化。用乔布斯的话来说，计算机是头脑的自行车。AIGC 加持下的计算机只是一辆更省力的自行车。

本轮 AI 浪潮的革新是以 GPT 为代表的 Transformer。一种有效的对数据序列的建模和预测方法。基于这种方法，很多以前的老问题会有新的解决方案，比如分子合成的研究。以前科学研究依赖一些朴素的统计算法，现在 GPT 提供了一种更强大的数据分析方法，这是科研工具的更新，直接的影响是可预期未来研究的速度会更快，会有更多的新的发现和发明。

LLM 是另一个意义重大的应用方向。ChatGPT 是 LLM 破圈的一款创新性产品，提供了一种人和机器高质量对话的交互方式。这种交互方式会产生长远的影响，未来人机交互会越来越多地变成对话（包括语音）。

回到计算技术是自动化这个目的上。LLM 更重要的能力我认为是代码生成。生成代码、调用函数、理解自然语言意图、生成自然语言。这几个能力产生了全新的完整的软件生产和执行机制。

软件的开发和运行方式被 LLM 重新定义了。

AI 短期内不能提供原创性想法，它不可能成为一个创造新理论和新发明的机器。它不会是人类的阿兰图灵。但是它可以非常高效地按照人的意图编写软件，我们这个世界会有无限量的 Jeff Dean 和 Linus Torvalds 供应，当然这只是致敬他们的编码能力，那些工程上的奇思妙想 AI 还是望尘莫及。

当有 10000 个全世界最顶级的程序员供我驱使的时候，我能用他们产生什么价值呢？这可能才是更要命的问题。我会让他们帮我生产 100 万个抖音短视频吗？听起来有点荒诞，而且不符合经济规律，因为这个能力是普惠化的，每个人都生成 100 万个短视频并不会提供 100 万个想法、段子和美好生活的点滴，只会让信息冗余度变大，有效信息获取更困难。这时候让这 10000 个程序员来过滤无效信息反而可能是更有市场的想法。

更现实的问题是，我目前并没办法用 AI 搞到 10000 个 Jeff Dean。这是一个值得努力的方向。LLM 驱动的软件在淘汰了程序员的同时也为程序员创造了很多需要解决的问题。

GPT4 或 StarCoder、 Codellama 这种专门训练的代码生成 LLM，已经表现出来很不错的代码生成能力。但是还不够优秀，更强的代码生成模型是一个基础的需求。

LLM 生成的代码需要在安全的环境中执行，这对代码执行沙箱，服务弹性都提出了要求。代码执行过程中也会涉及到数据的访问，隐私和数据安全问题也需要解决。

函数调用能力让 LLM 能够根据需要动态的执行模型外部功能，这可以极大地扩展 LLM 软件栈的能力。对于自然语言意图的理解和函数的选择，以及多步函数调用组成工作流的编排是 LLM 需要继续加强的。已经有很多模型专门优化函数调用和编排。

一个人工辅助编写的开箱即用的 LLM 专用函数库也是很有吸引力的想法。这些函数库可以集成现有的基础设施、API 或 RPA能力。让 LLM 可以实现更大粒度的自动化任务。

另一个让 LLM 执行更大粒度的任务的方法是让 LLM 能够自主推理。ChatGPT 式的对话是人和模型交互迭代最终结果的过程。LLM 自己也可以完成某些自动迭代，这是目前一些像 ReAct 或 Multi-agent 推理框架试图解决的任务。

数据依然是最有价值的部分。如何让 LLM 能够更高效地处理数据也成了新问题。比如 RAG，向量数据的存储、检索带来了新的工程挑战。

LLM 定义的软件技术栈可能才更像 PC 和互联网提供的创新机会。只是新的 Apple、Google 和 Facebook 是什么样呢？他们会基于新的技术栈构建怎样的应用、商业模式和开发者生态呢？

LLM 技术栈，有很多可以做的事情。当然，想获得“成功”，想清楚让这 10000 个程序员做什么才是更重要的。商业上的第一性原理，还是要回答我要为谁提供什么价值这个终级问题。我没有答案。

做多！

蟹壳

作者 shellc

2023年12月23日 08:00

是时候做多沪深 300、上证 50、创业板了

10 月 24日，《特殊时刻》这篇文章重点讨论了美债收益率对 A 股估值的影响，并确定当时是一个很特殊的时刻。没想到仅仅过去两个月，情况就发生了翻转。

时间点非常凑巧，在《特殊时刻》发布后，美债收益率开始掉头向下。

中美国债

我们计算的风险溢价指标（ROR）反应非常灵敏，直接从 21% 分位值翻转到了 94%。同时，随着指数的下跌，PEPB 指标进一步达到了 1.18% 的位置。

沪深300估值

从估值来看，沪深 300 、上证 50 和创业板指数已经进入极度低估的状态。如果未来 10 天指数上涨，形成斜率为正的趋势。根据《宽基择时指标》，我们的宽基择时系统将正式发出做多信号。

决定股市未来走向的因素主要有两个，一个是盈利水平，一个是利率水平。当前美债收益率在下行趋势中，且一致预期未来会进一步下降，国内也刚完成新一轮降息。2024 年利率下降是大概率事件。

国内经济方面，政策和舆论已经开始发力，虽然市场选择了无视，但是只要预期出现反转，这些因素都会成为价格变化的正向因素。经济的基本面其实也没那么差，2023 年依然有 5% 以上的增长，2024 年的目标也不会低于这个速度。市场过于悲观了。

A 股接下来的走向可能就成为：中国经济中速增长，利率下行，预期翻转，牛🐂。

密切关注接下来两周指数的变化，做多。

如果大模型跑在每一部手机里

蟹壳

作者 shellc

2023年11月1日 08:00

我们可以预期 LLM 主要应该是运行在 PC 、手机、汽车和其他智能机器的本地。这其中很重要的原因是算力的发展和 LLM 的优化。这同时也解决了隐私和数据安全问题。云上运行 LLM 推理是没有道理的。

2023 年 10 月 24 日，高通发布骁龙X Elite，采用 4nm 工艺，集成 NPU 提供 45 TOPs 算力，支持运行 13B 参数的 LLM。高通表示其设计初衷是支持未来的高负载智能任务。

2023 年 10 月 31 日，苹果发布 M3 系列芯片，采用 3nm 工艺，其中 M3 Max 提供 16 个神经网络核心，35TOPs 算力。苹果 M2 就已经可以运行LLaMA-2 7B，M3 Max 跑 13B 以上的模型应该没有压力。

这两款 CPU 的出现，预示着一些可能性正在发生。这些可能性以 LLM 带来的新应用场景为基础，带动算力升级，算力升级又催生了新的应用形态的繁荣。

过去 10 年里，除了一些视频和 3D 处理的高负载任务外，PC 算力应该说是严重过剩的。PC 芯片的优化方向是低功耗，而不是高算力。这和 PC 的应用场景有很大关系，过去 10 年 PC 作为生产力工具和游戏娱乐平台，并没有出现新的高负载应用场景。英特尔 i5、i7 其实已经是 10 多年前的产物。直到 2020 年苹果发布 M1 算是开启了 PC 芯片算力的升级。

回看过去几十年的软硬件发展过程，算力和应用是阶段性相互推动的。最初摩尔定律推动了芯片集成度越来越高，导致了 PC 和图形界面的出现。视频、游戏应用的需求催生了 SSE、GPU 等指令集和专用芯片的产生。移动化对 CPU 的小型化和功耗又提出了更高的要求。当下，AI 应用和 LLM 的爆发可能会导致 CPU 的发展方向出现新的变化。

骁龙X Elite和 M3 Max都可以运行 13B 以上的 LLM，据说 OpenAI GPT-3.5的参数数量也就 20B，我们可以预期在未来一年，PC 芯片可以非常流畅地运行高质量的 LLM 。更远一些的未来，我们可以预期 LLM 主要应该是运行在 PC 、手机、汽车和其他智能机器的本地。这其中很重要的原因是算力的发展和 LLM 的优化。

为什么 LLM 不应该以云计算形态提供。现在说的云计算提供的是零星算力的聚合和弹性供给能力，它很好地解决了互联网应用对于算力的需求。这不意味着云计算是所有应用场景的最优选项。比如大型 3D 多人在线游戏，计算主要发生在客户端，没有人会认为 3D 渲染任务应该在云端完成。LLM 也是一样，无论从成本、体验、隐私和数据安全角度来看，LLM 运行在终端远优于运行在云端。应用需要互联网和计算，但是不一定需要互联网和计算耦合的云计算。云计算更适合数据存储和交易类型的负载，不适合把渲染、人机交互类的计算任务放到云端。LLM 恰恰是这类任务。

LLM 作为一种通用的 NLP 模型，当然也适合在云端完成一些任务，比如数据分析。从算力消耗来统计，终端对 LLM 的需求显然远大于云端。

如果 LLM 更适合运行在终端，那么 LLM 将会成为操作系统和浏览器的内置能力。我们可以预期未来几年 Window、 MacOS 、 iOS 和 Android会带来几次重大升级，LLM 是每台 PC、Pad和手机的标准配置。这就像2000年初语音识别技术突破后，Windows XP中内置了语音识别和语音合成一样，不过语音识别技术并未带来交互上的重大改变。

为 LLM 而升级的硬件，也可以被用来做其他计算，比如图形渲染、科学计算等等，这也会导致其他应用场景的升级和创新，比如更智能和更具沉浸感的元宇宙。甚至大部分商业数据处理之类的任务可能也都可以本地完成了。这就完成了一轮应用推动硬件升级，硬件升级又推动更多应用场景升级的循环。沉浸式元宇宙和Web3也会受益于这轮硬件升级，和 AI 在某个场景中产生完美的融合。

如果大模型跑在每一部手机里，消费级芯片和终端软硬件生态才是未来的增量市场。赌摩尔定律失效，等待芯片代差逐渐缩小可能不会实现。大规模提前建设数据中心可能也是一种浪费。

未命名

蟹壳

作者 shellc

2023年10月26日 08:00

未命名

买股票就是买企业所有权，这句话是错的。所有权是一种能决定企业重大决策、利益分配的权利，微型股东根本没有这种权利。这句话对巴菲特是成立的，因为他买的份额足够行使这种权利，所以他可以通过改善企业治理、资产重组甚至清算实现对自己有利的利益分配。

持股收息是实现投资收益的根本途径。这句话也是错的，因为小股东没有权利决定是否分红和分红比例。如果存疑，请听听董小姐怎么说。

价格由市场参与者的共识决定。有效市场理论是一种对市场信息处理有效性的假设，不是对绝对价值定价有效性的假设。

投资二级市场实现收益的途径是市场价差。投资者获利的直接手段是低买高卖。

量化投资不是一种策略，也不是一种具体的方法论，只是对某些工具的使用。三因子是量化投资，文艺复兴是量化投资，巴菲特是量化投资，看K线的小散也是量化投资，只是他们量化的工具和对象不同。

因子找到的不一定是因果关系，可能只是相关性。巴菲特决策的依据大概不是相关性而是因果关系。黑天鹅是从对统计结果的迷信中孵化出来的。

多因子构建投资组合依赖低相关性因子，A 股的市值、价值、成长、质量、波动等常见因子都具有很强的相关性，超额收益和低波动性不可兼得。

特色因子是算力和数据的军备竞赛，效用函数趋近于零。

随机事件预测模型要么是一种关于真理的伟大发现，要么是一种金融工程的伟大发明。

市场是由人组成的，人性并不总是理性的。行为经济学比数学更重要。

年轻人的赌性正在增加，以前 996 是为了买房，现在是为了在加密货币和股市里梭哈。都有一个韩国式的未来。

人民群众是最有力量的，市场就像两帮壮汉拔河，一会儿左一会儿右，决定向哪个方向崩溃的可能只是一个新加入的小孩。

市场参与者所持武器的差距远大于烧火棍和原子弹之间的差距。不要和手持做空工具+高频程序的人为敌。

在不同的时间尺度上博弈，需要配合完全不同的武器。如果看到对手的武器更厉害，那大概是因为你选错了战场。

有影响力的价值投资者都在卖书，书里都有一个成功案例叫茅台。

因为在2013年选择了茅台所以是价值投资者，还是因为是价值投资者才在2013年选择了茅台。有根本的不同。

永远不要用“价值投资”来定义投资策略，因为不存在这种东西。

所有的投资都是在某个时间尺度上对某种概率的下注。想清楚概率估计是基于统计的还是因果关系的，期望收益如何，三个标准差之外的结果是否可接受。

护城河、安全边际和市场先生是可以量化的。

巴菲特说“别人贪婪的时候我恐惧，别人恐惧的时候我贪婪”，不要虎躯一震，觉得英雄所见略同，他说的“别人”其实就是你。

趋势是嵌套的，在海啸面前区分细浪、中浪和大浪都没有意义。

特殊时刻

蟹壳

作者 shellc

2023年10月24日 08:00

A 股又到了选择方向的时刻

根据过去十年的数据回测发现，通过 PEPB 和风险溢价对沪深 300 择时，能比较准确地发现相对底部和顶部。当下（2023年10月23日），沪深 300 又发出了底部做多信号。下图是根据 PEPB<3% 分位值且 ROR>92% 分位值拟合的多空信号。

沪深300 择时信号

当下可以做多沪深 300 吗？虽然 “这次不一样”在 A 股市场通常是被嘲笑的一句话，不过这一次确实有些不一样。

这次不一样的原因是风险溢价的计算，2022 年之前的十几年时间里，中国的利率水平总是高于美国的。使用中国的十年期国债作为无风险资产来给股市定价其实是选择了一种比较高的无风险利率。而 2022 年开始，美债收益率开始高于中国国债，再用中债来作为无风险利率，就无法反应实际情况了，事实上全球的无风险收益率是升高了的。这就是当下 A 股面对的“不一样”。

中美国债

风险溢价（ROR）是风险资产（股票）相对于无风险资产（国债）的溢价水平，当无风险资产利率升高，风险资产的估值就会相应下降。

使用中国 10 年期国债作为无风险收益计算的 ROR 五年滚动分位数是 96%，已经处于历史极值的范围，说明沪深 300 相对无风险收益严重低估了。是抄底的好时机。

沪深300 PEPB & ROR

但是，当使用美国 10 年期国债收益率和中国 10 年期国债收益率最高者来计算风险溢价，当前的分位数是 21%，处在估值偏高的范围。

沪深300 PEPB & ROR

两种无风险收益率计算的估值导出了完全相反的结论。

此时此刻，是特殊的。

决定股市未来走向的因素主要有两个，一个是盈利水平，一个是利率水平。当下，这两个因素都处在极端状态，盈利水平由实体经济发展决定，利率水平由中美根据各自的国内情况决定。未来 A 股的几种可能走向：

中国经济高速增长，美债利率下降：疯牛
中国经济中速增长，美债利率下降：牛
中国经济低速增长，美债利率下降：分化
中国经济高速增长，美债利率维持：分化
中国经济中速增长，美债利率维持：分化，长期熊
中国经济低速增长，美债利率维持：下一个台阶后长期熊
中国经济高速增长，美债继续升高：分化
中国经济中速增长，美债继续升高：分化，长期熊
中国经济低速增长，美债继续升高：下一个台阶后长熊

中国经济比较理性的预期是中速增长，GDP 4~5% 的区间。美债利率取决于美国内就业和通胀情况，也和地缘政治、大国博弈有关。虽然80年代美债利率曾经到过 15% ，这也不意味着美债还可能到达相同的位置。美债三种可能性都有，可能都不会偏离现在的水平太远，也就是预期既不会大规模降息，也不会大规模升息。

所以，中国经济中速增长和美债维持的可能性较大，A 股分化，长期底部震荡，部分盈利质量高的公司稳定增长。这种情况下，高质量增长和股息是市场追逐的目标。

决定经济和利率的更根本原因还是老大的那句话“中美合则两利，斗则俱伤”。一个新的蜜月期可以把两方的问题都解决掉，但是历史的关键节点是由少数人决定的。如果选择长期对抗，ALL-IN 零和博弈，那就得看谁的命硬了，赢家通吃，泼天的富贵也未尝可知啊。不过也得考虑个人寿命的长短，能不能等来这一天。这真是一个特殊的时刻。

宽基择时组合

蟹壳

作者 shellc

2023年10月13日 08:00

一个基于沪深300、上证50、中证500、创业板指数、上证红利和国债指数构建的宽基择时组合

宽基择时指标直观上看好像是有效的，为了验证实际效果，我们使用历史数据回测一下。回测起止时间为 2013 年 1 月 1 日至 2023 年 10月 12 日，总收益率 141.34%，超过沪深300 97.84%，年化收益率 8.53%，超过沪深300 5.12%，最大回撤 25.25%，低于沪深300 21.63% 。

沪深300 择时回测结果

如何评价这个结果呢。首先好的一方面是正确率较高，抓住了两段行情主升阶段。一段是 2013 年开始的满仓到 2015 年 6 月份的清仓，另一段是 2020 年 5 月满仓到 2020 年 12 月清仓，这是收益产生的原因。

表现不好的主要是两点，一是召回率不高，也就是说漏掉了一些阶段性顶和底，这会错过交易机会，也就是导致了长达五年的空仓。第二是底部范围有点大，特别是 2013 年那段。底部范围大就会导致提前抄底，经历更大的回撤。

从绩效指标看，这个策略是好于买入持有沪深300的。召回率不高和抄底过早理论上来说问题并不大，但是实际上却不容易实践，因为时间跨度太长，人是很难执行这样一个策略的。空仓五年等一个机器发出的交易信号，全部身家满仓，这很不靠谱。我们需要增加一些交易机会，让自己在市场上有事干。

我们把国债加进来，构建一个组合，看看是不是能带来更多的交易机会。

沪深300+国债ETF 择时回测结果

其实并没有增加交易机会，因为这是沪深300和国债的满仓轮动组合，股债的轮动信号和沪深300择时是一样的。

惊喜的发现是，这个组合的表现要远好于沪深300择时。总体收益率在沪深300择时的基础上增加了 86.69% 达到了 228.03% ，年化收益率 11.66% ，增加 3.13% ，最大回撤保持 25.25% 。而且年度胜率达到了 100% 。

单独持有国债总体收益率是 50.16 %，为什么沪深 300 和国债组成的组合却能提高 86.69% 的收益率呢？原因也很简单，是沪深300 择时在最初的三年增大了本金。看起来一个阶段性大幅升值的资产加上无风险收益，是有更大的复利效果的。

交易机会少的问题还是没有解决，我们需要更多的交易机会，让自己一年里至少有几次事情可以做，才可以保证不把这个事情忘掉。

我们加更多宽基指数进来看看。老牌的宽基指数有沪深300、上证50、中证500、创业板指数、上证红利。他们在市值、行业上有一些区分度，不过成分也是有一些重合的。构建组合最好是选择一些相关度更低的资产，这样的好处就是不会同涨同跌。我们来计算一下这些指数的相关性看看。

宽基指数相关性

除了国债指数，宽基之间的相关性其实还是挺高的，好在也有一定的差异，应该可以增加一些交易机会。我们来回测一下。

宽基择时回测结果

这个组合的整体收益率达到了 282.83% ，年化收益 13.28%，最大回撤下降到了 17.67%。所有指标都在变好，年胜率 80%。看上去相当不错。交易机会也增加了一些，下面是仓位情况。

宽基择时仓位

交易机会的增加相对有限，还是有最长两年多的时间仓位是不变的。不过换个角度想，对有些人这可能也是一件好事。对于普通人，交易机会可能就不应该那么多。

我们的回测时间接近十一年，投资过程中的正反馈很重要，用十年时间在现实世界做一个实验代价还是太大了。而且2013年是一轮熊市的底部，以这个时间为起点说不定是运气好。我们把时间缩短到五年看看。

宽基择时回测结果

从 2018 年 1 月 1 日起，总收益 57.86，沪深300总收益 -9.41%，年化收益率 8.23%，沪深300年化收益 -1.7% ，最大回撤 9.21%，沪深300最大回撤 40.77%，年胜率 80%，沪深300 40%。可以说相当不错。

这个组合还有一个进阶玩法，就是在出现做空信号的时候使用期权做空对应的指数。因为我们的指标生成的做空信号准确率是很高的。这应该会大幅提升整体收益率。不过指数期权不是一般人玩的东西，这里就不做展开了。

最后。这个策略是对历史的回测，并不代表对未来也适用。生成信号的指标是根据历史统计选择的最好参数，虽然 PEPB 和 ROR 在逻辑上是比较坚实的，这还是对历史一定程度上的过度拟合。从宏观角度看，过去四十年的低利率、科技发展、中国经济模式在未来可能都会有变化。说不定我们目前就处在经济的历史巅峰，也有可能人民币获得了收取全球铸币税的特权。如果沪深300未来的发展像 S&P 500一样牛长熊短，这些过去的模式可能就完全失效了。

（完）

宽基定投是圣杯吗

蟹壳

作者 shellc

2023年10月12日 08:00

宽基定投被一些人认为是个人投资者的圣杯，可以《轻松+愉快》地把钱赚了。世界上有这么好的事吗？我们来研究研究。

据说用基督受难前使用过的杯子喝水可以获得化腐朽为神奇的魔力，比如返老还童、死而复生。宽基定投也被一些人认为是个人投资者的圣杯，可以《轻松+愉快》地把钱赚了。世界上有这么好的事吗？我们来研究研究，就用大家耳熟能详的沪深300指数作为研究对象。

要评价投资业绩的好坏得有个标准，比如公募基金喜欢和沪深300指数比收益。那沪深300指数和谁比呢？就和国债比吧。国债一般被认为是无风险的收益。因为国债是政府信用背书的债务，像我们这样的未来世界第一强国，国债可以认为是没有风险的。

下图是国债指数的走势，就是这么耿直。

国债指数

最近十年年华收益率稳定在 3~5%之间。

国债年化收益率

保守的投资者喜欢买银行理财，美其名曰稳稳地幸福，如果他们知道银行理财底层资产是啥，估计就不会这么想了。当然这是题外话，重点是，国债是真正的无风险收益。

个人投资者通常在心理上是要求投资兼具储蓄和高收益两个目标的。储蓄很好理解，就是我什么时候想存就存，什么时候想取就取，稍微专业一点的说法就是要有高流动性。高收益就因人而异了，如果对于3%的国债收益满足，那么这个人就是一个幸福的人。因为只需要买国债 ETF（511010）就可以了，流动性和收益率都能获得满足。

如果预期收益率超过了无风险收益率，就需要承担额外的风险了。一般认为沪深300这样的宽基ETF是比较好的风险投资工具。宽基是一篮子股票的组合，很多人把投资宽基叫做投资国运。下图是沪深 300 自 2013 年 1 月 1 日期至今（2023 年 10 月 11 日）将近 11 年的走势。

沪深300走势

假如我相信投资沪深300就是投资国运，我打算把全部储蓄一次性投入沪深300ETF。我们来看看不同的入场时间，持有至今会获得什么样的收益。

买入持有沪深300收益

从上图可以看出，运气最好的话是 2014 年 3 月入场，持有至今共获得 78% 的收益，年化收益率大概 5%，比国债好一些。其他任何时间都会很惨，比如最惨的 2015 年 6 月入场，持有至今收益 -30%，2021 年 2 月入场，持有至今总收益 -37%。这样的收益率，一般人估计都会抑郁的。

为什么会这样呢，不是说买沪深300等于买国运吗？我们的国运这么惨吗？原因在于沪深300的特点，就是长期趋势向上，但是波动性很大，波动周期以3~7年记，而且牛短熊长。因为当下正处在一个底部位置，所以用当下作为终期来做这个测试，结果就是这样惨。如果以未来某个高点位置做测试，结果就会好很多。简单来说，任意时间买入持有沪深300，大概率我们大部分时间是亏损的，只在少量时间获得正收益。我们可以得出一个结论，买入持有沪深300是不可取的投资方法。

一次性买入持有不行，我定投总可以吧。而且我的本金是每个月节省下来的，我本来就不会一次性投入一大笔钱。定投听说可以摊薄成本，穿越牛熊。

假设我从 2013 年 1 月 1 日开始，每个月定投 1000 元。至今一共定投 130 期，投入本金 13 万，资产总计 13.87 万。What?! 11 年啊，总收益只有 8700 块钱？！（总资产趋势见下图）

定投沪深300收益

这还不是最扎心的，最扎心的是，这十年中，还要经历高达 30% 的回撤。回撤是什么意思呢？就是期间从最高点到最低点跌了 30%。十年时间基本没有收益，还要面对中间 30% 的下跌。这怎么看都很虐心啊。（回撤情况见下图）

定投沪深300回撤

我们把沪深300换成国债定投会怎么样？同样是 2013 年 1 月 1 日开始，每月定投 1000 元。截止目前，一共定投 130 期，投入本金 13 万，资产总计 16 万。年化收益 3.86%，最大回撤 0.67 %。这才是稳稳地幸福呀。

定投国债

所以，不管是一次性投入还是按月定投，对于要求流动性和投资体验的人来说，投资沪深300都不如投资国债ETF。宽基定投不是投资圣杯。

难道我们真的就不能共享国运了吗？

有人发现了一个规律，沪深300总是阶段性大幅波动的，我只要在低点买入，高点卖出是不是就好了。确实如此。但问题是，我怎么知道什么时候是高点，什么时候是低点呢？

有人说根据市盈率百分位值来定投，25% 分位值以下定投，75% 分位值以上停止定投或卖出。

沪深300市盈率分位数

上面是沪深300的市盈率统计。看上去市盈率分位值确实比较精准地找到了市场的低点和高点。这也是很多投资网站和App都会给出的一张统计图。

但是这张图有几个致命的缺陷。第一点，这张图上的市盈率分位值是根据过去十年的市盈率做的统计。也就是站在现在看过去，一目了然。问题是，我们在过去的对应时点，是不可能知道未来的情况的。这张图可以分析历史，却不能预测未来。

第二点，交易信号非常少，买入和卖出的交易几年才会出现一次。这就意味着大部分时间我们的钱是闲置的。

第三点，交易信号并不完全准确，一旦出错，就要面对踏空或巨幅回撤。

关于第一点，改进方法很简单。就是只用过去一个固定周期的数据做统计，这样至少我们回看历史，不会带着上帝视角。比如选择五年作为周期，覆盖一个牛熊过程。得到下面这张五年滚动市盈率分位值统计图。

沪深300市盈率滚动分位数

是不是隐隐约约感觉接近财富密码了？先别高兴，交易信号少，以及信号准确度问题依然没有解决。而且，到此为止，其实我们的问题已经变得更复杂了。我们本来想找投资圣杯，躺着把钱赚了，却发现要做越来越多的决策了。现在的问题变成了如何选择正确的时间买入卖出，也就是择时问题。

宽基到底能不能择时，怎么择时，我们后面再聊。

宽基择时指标

蟹壳

作者 shellc

2023年10月12日 08:00

有没有可能精准地抄底和逃顶

《宽基定投是圣杯吗》这篇文章的结论是宽基投资并不简单，既不能无脑买入持有，也不能无脑定投，择时很重要。本篇就来研究一下择时问题。本文参考了国泰君安在2023年3月发布的《宽基指数如何择时：通过估值、流动性和拥挤度构建量化择时策略》这篇报告。本文在这个策略的简化版基础上做了一些调整。

第一个是 PEPB 估值指标。PEPB 指标是 PE 估值分位数和 PB 估值分位数的几何平均值。高 PEPB 代表市场估值较高，低 PEPB 代表市场估值较低。

沪深300 PEPB指标

因为增加了 PB，这个指标比单纯的 PE 分位值指标提供了更多信号。

第二个指标是股权风险溢价(ROR)，ROR 是 PE 倒数与国债收益率的差，用来衡量股票收益相对无风险收益率的高低，高股权风险溢价代表市场低估，低股权风险溢价代表市场高估。计算方法和国君稍有差别，我们选择使用中国2年、5年、10年、美国2年、5年、10年国债收益率的最高者作为无风险收益。因为 A 股市场外资比例是比以前高的，美债收益率对流动性的影响越来越大，比如 2018 年和 2022 年至今这段时间。

沪深300 PEPB、股权风险溢价指标

我们统计一下这两个指标的有效性。用不同的百分位数来预测信号发生后20天、90天和120天后的平均收益率和预测胜率。

	20胜率	90胜率	120胜率	20收益	90收益	120收益	信号数量
PEPB > 0.99	100.00	100.00	100.00	-11.51	-9.04	-12.94	4.00
PEPB > 0.97	70.59	100.00	100.00	-8.27	-11.28	-13.87	34.00
PEPB > 0.95	72.09	100.00	100.00	-7.60	-10.69	-13.47	43.00
PEPB > 0.92	72.73	96.36	96.36	-7.29	-11.64	-13.75	55.00
PEPB > 0.90	71.26	88.51	88.51	-5.34	-11.15	-12.89	87.00
PEPB < 0.01	49.63	54.48	66.79	0.36	2.81	5.74	268.00
PEPB < 0.03	50.48	52.42	58.41	0.20	2.14	4.73	517.00
PEPB < 0.05	52.77	49.03	52.02	0.32	1.24	3.44	669.00
PEPB < 0.08	49.94	47.13	48.11	0.10	1.10	2.55	833.00
PEPB < 0.10	50.83	47.30	47.41	0.20	1.23	2.64	903.00
ROR > 0.99	57.00	73.43	79.23	1.12	6.82	11.82	207.00
ROR > 0.97	52.57	58.68	63.08	0.46	4.04	8.09	409.00
ROR > 0.95	55.60	54.85	58.21	0.93	3.50	6.63	536.00
ROR > 0.92	53.38	52.70	55.95	0.81	3.18	5.24	740.00
ROR > 0.90	52.20	51.46	53.78	0.73	3.05	5.05	820.00
ROR < 0.01	70.97	100.00	100.00	-10.20	-27.34	-24.42	31.00
ROR < 0.03	53.75	97.50	96.25	-3.70	-18.58	-17.45	80.00
ROR < 0.05	56.03	90.52	88.79	-2.88	-15.90	-15.79	116.00
ROR < 0.08	47.34	72.46	77.29	-0.90	-9.24	-10.76	207.00
ROR < 0.10	38.41	57.62	62.58	-0.03	-4.78	-6.40	302.00
TREND > 0	54.51	55.16	53.97	1.34	7.33	9.65	2682.00
TREND > 1	58.05	56.60	54.94	2.62	11.10	13.40	820.00
TREND > 1.5	60.73	59.95	56.50	3.57	15.14	17.37	382.00
TREND > 2	62.35	68.82	65.88	4.82	23.50	27.11	170.00
TREND < 0	49.53	55.19	54.12	0.10	0.55	2.14	2318.00
TREND < -1	50.46	58.52	58.10	0.06	-0.46	0.74	648.00
TREND < -1.5	48.26	54.73	60.65	0.62	1.12	1.81	344.00
TREND < -2	47.06	49.73	59.36	0.78	3.14	4.07	187.00

由统计结果可以发现，PEPB 和 ROR 对于预测顶部位置是非常有效的。预测底部的胜率就很一般。看来逃顶比抄底要容易很多。

结合 PEPB 和 ROR 两个指标，我们能比较准确的逃顶，抄底的准确率只是稍微高于 50% 。这还不够，因为信号的发生还是太多了，我们加入一个趋势指标，优化一下，在 10 日价格趋势上升的时候确认做多信号，在 10 价格趋势下降的时候确认做空信号。

虽然趋势指标的预测胜率也只是略高于 50%，不过加入趋势信号后，我们大幅减少了信号量的密度。

三个指标结合后我们看一下对沪深300指数的顶部和底部位置的识别效果。

沪深300择时信号

逃顶的效果非常不错，抄底就差强人意了。我们可以调整信号生成的阈值，识别更多底部信号，不过这是要用更大的回撤作为代价的。

上篇文章中我们说信号少是个坏事，本篇我们却努力去减少交易信号。这是为什么呢？因为考虑的角度不同，上文中我们假设我们只能投资沪深300一个标的，如果交易信号少，就意味着大部分时间我们是持币观望的。我们现在减少交易信号，是要优化准确率。

有没有办法既提高准确率又提高资金利用效率呢？如果我们能用多个走势不同的宽基指数来做一个组合，是不是就完美了呢？下次再聊。

不要买基金

蟹壳

作者 shellc

2023年10月11日 08:00

投基金真是个又难，又高风险的事情。

国内的公募基金经理快成了一个人人喊打的高危人群，而两年前他/她们还是基民口中的男神、女神。基民对基金经理的疯狂感情一度堪比饭圈，基金公司也是像打造流量明星一样打造基金经理的人设。现如今一个个人设坍塌，真是眼看他起高楼、眼看他宴宾客、眼看他楼塌了。

比如医药女神，据说十年累计亏损 200 多亿，管理费却赚了 30 多亿，个人也实现了别野自由。有人说女神的基金阶段性是大赚的，在高点你不卖怪谁呢？对于普通人来说，买基金不就图个省心吗？买基金还要择时，那我还买基金干嘛？再说了，我要是有能力择时，我不就去股票市场追涨杀跌了吗。

我很早就和身边的人说，不要买基金。原因倒也不是我有什么先见之明，提前预见了今天的局面。虽然很看不惯基金公司玩流量搞饭圈化。根本原因还是因为公募基金本身就存在天然的问题。

首先是基民和基金经理的利益不一致。用塔勒布的话说，就是“非对称风险”。基金公司和基金经理赚的是管理费，管理费只和基金规模有关，和基金收益是无关的。100亿的规模，基金公司就收 1、2亿管理费，1000 亿的规模，他们就能收10、20亿，而且是每年。那么为什么看上去他们也很在意收益率和排名呢？根本原因还是为了流量，促进销售。基民买基金的时候历史收益率和排名是很重要的决策依据。

问题在于，他们的收益率和排名都是阶段性的。有人做过统计，基金经理的年度排名呈现非常随机的分布。说白了，运气的成分很大。而一旦某年获得了金牛奖，这可能就可以拿来营销很多年。这和演员热衷拿奖差不多。今年你看到了“风越大鱼越贵”，就看到了很多广告代言，可是前几年你都不知道他是谁吧。基金经理一旦拿到金牛，他就会在大量基民面前曝光，获得流量，基金大卖，规模迅速增长。其实他的投资能力并没有变化，悲剧也就是注定的了。

搞人设，玩流量，做规模，赚管理费，这还算好的，毕竟合法合规。更可怕的是玩老鼠仓，拿这基民的钱给自己抬轿子。这类案例前两年也发生过。

这第一个原因就是利益不一致带来的道德风险。

再者，公募基金是有很多硬性的仓位限制的。就是说不管市场是什么情况，他都必须按照规定保持仓位，而且这个仓位要求并不低。你以为基金经理很专业，可以帮你追涨杀跌，现实是，很多时候他们只能装死。而且一旦市场行情不好，基民开始赎回，就会导致基金被迫在低位卖出，形成相互踩踏，一个和市场合力的下降螺旋就此产生，带崩整个市场，这也很多熊市最后一大跌的原因之一。

所以，什么养基、定投、只买不卖最后都会在一地鸡毛里收场。

当然，也不能一杆子打翻一船人，肯定还是有不少有职业道德和操守，又敬业热爱基金行业的基金经理的。就比如曾经有基金经理用各种隐晦的办法暗示基民赎回。因为法规限制和栖身基金公司，他们能做的也就这样了，至于能不能接收到信号，能不能破解出信息，那就看基民的造化了。

还有一个原因是选择困难。都说选股票难，要在现如今5000多支股票中选出几支来，确实挺难的。但是很少有基民想过，基金的数量可是远多过股票的，目前保守估计基金有超过 8000 多支。选股票还可以看看法律规定格式的财务报告，上市时间长的，甚至可以看出十几年的经营变化。选基金经理怎么选，就是那么几年的业绩表现和过往荣誉了。你肯定不会跟了解程度这么浅的人谈婚论嫁，为什么就愿意把辛苦攒的嫁妆给了他呢。

所以吧，投基金真是个又难，又高风险的事情。并不是说没有好基金，也不是没有好基金经理。只是，在现有的游戏规则下，找到他们太难了。不比买股票的难度和风险小。普通人，就不要买基金了。这里说的基金特指公募股票型基金。

宽基定投是很多被基金和股票伤了心的人以为的圣器，究竟是不是呢？以后再聊。

独立开发者，你准备好做一个网红了吗

蟹壳

作者 shellc

2023年9月5日 08:00

流量是大部分产品的生死之地，这和当下互联网的所有商业模式没有太多本质区别。独立开发者要做的是通过软件提供价值，通过获取流量，把软件价值变现。所以，即使开发者个人不是一个网红，也要让自己的产品努力成为一个网红。

独立开发者是指一个人独立开发一款软件，产生持续的现金流，时间和财务上都获得自由，是一种让人很向往的生活和工作状态。特别是在当下，职业稳定性的焦虑弥漫了整个行业，独立开发者成了现在的热门话题。

国内外一些成功独立开发者的故事也鼓励了很多人，他们的成功很多都是因为做了一个看起来很简单的软件。这让很多开发者感觉自己的技术比他们大多数人都好，自己也可以成为一个独立开发者。很多人就兴冲冲地开发了一款软件，却发现用户寥寥无几，付费用户甚至为零。理想与现实的落差是巨大的，绝大部分人可能就此止步了，不过我认为，这不一定是件坏事，这甚至可能是独立开发者走向成功的必经之路。

当我们开始讨论“独立开发”的时候，其实我们更多想到的是成功后的状态，让人向往，却没有仔细去思考实现这种状态的路径。“独立开发”这件事情如果被展开的话，我认为应该是“通过独立开发构建一个可以持续产生现金流的产品”。“独立开发”只是对事件主体的描述，“构建产品”是活动，“持续产生现金流”才是目标，是这件事情的核心。换个角度思考，如果有一件事可以持续产生现金流，大部分人应该是不在乎是否“独立开发”的。

大部分独立开发者是从手机App和小型SaaS两个方向入手的。这两个方向确实比较友好，一方面是投入较低，开通一个苹果开发者账号或者买个域名就可以启动；另一方面是市场成熟，商业闭环且完善。但是，这也不意味着随便开发个软件就可以等着收钱了，而且大概率是赚不到钱的。

从商业的角度来想一下，我们开发的软件如何才能变成收入。首先，要有人看到我们的产品。然后，看到我们产品的一部分人对产品感兴趣，下载或注册我们的产品试用。接下来，有人愿意为我们提供的高级功能进行付费。最后，给我们付费的人持续使用我们的产品并愿意每个月都付费。我们自己也买过软件，其实好好想想一款什么样的软件才能让我们持续付费呢？这是很难很难的一件事情。

这个过程是一个流量转化漏斗：流量->下载转化率->付费转化率->留存率。这个漏斗和电商的流量转化漏斗没有本质区别，所以从商业角度来说，独立开发和电商卖货也没有本质区别。如果只看流量获取和转化，独立开发甚至跟短视频博主也没有区别。只不过独立开发者卖的是自己开发的软件，电商卖的是实物商品，短视频是帮助别人做商品付费转化。

这个过程还可以表示成一个数学公式：(流量 x 下载转化率 x 付费转化率 + 存量付费用户数 x 留存率) x 客单价 = 收入

这个公式是独立开发者需要想清楚的，而且其中变量的具体数值是与你的产品相关的，需要在市场上测试获得。以iOS App为例，假设下载转化率 3% ，付费转化率 2% ，留存率 30% ，客单价 18元/月。如果我们希望每个月收入 10000 元。在启动之初，存量用户为零的情况下，我们需要多少曝光呢？

曝光 = 10000 / 18 / 3% / 2% ~= 92.6 万

也就是说我们在第一个月需要 92.6 万次App Store曝光才能获得 10000 元收入。事实上，一个很普通的App，一个月的曝光量可能都很难超过 2000 次。

要改善我们的收入，需要针对不同的变量做针对性的思考。特别的，与木桶理论相反，商业优化更关注投入产出比和长板效应，就是我们要关注那些我们可以更容易提升的指标，而不是死磕那些我们很难提高的指标。

流量：如果客单价、下载、付费转化率、留存率都很低，那么唯一能做的事情就是尽量多地获取免费流量。SEO和社交媒体推广就是重点工作，这也是一些看上很成功的独立开发者在社交媒体上很活跃的原因。如果客单价 x 下载转化率 x 付费转化率 > 广告投入，这时候就可以考虑投放广告了。

转化率：影响转化率的更多还是产品本身的市场匹配程度。如果产品的目标用户定位是特定用户群体，那就多针对这个群体进行营销设计和推广，不要把精力浪费在非目标用户身上。

客单价：高客单价产品是开发者要努力追求的，高客单价就意味着产品价值更高，产品达成相同收入对流量和转化率的要求就更低。

最好的情况当然是我们开发出了革命性的创新产品，人人都想拥有，自发口碑传播，定价高，收钱收到手软。但是对刚起步的独立开发者来说，踏踏实实地实现商业落地，让自己的付出获得合理的回报才更现实。独立开发者在技术方面往往不存在瓶颈，商业思考才是，要多把时间花在思考和低成本测试商业模式上。脑袋里装着上面的流量转化公式，搞清楚产品的努力方向。

回到这篇文章的标题，流量是大部分产品的生死之地，这和当下互联网的所有商业模式没有太多本质区别。独立开发者要做的是通过软件提供价值，通过获取流量，把软件价值变现。所以，即使开发者个人不是一个网红，也要让自己的产品努力成为一个网红。至少，用这个思路，往这个方向去做。当然，要想“成功”，创新和运气就更重要了。

和ChatGPT讨论隐私和知识产权保护方案

蟹壳

作者 shellc

2023年4月12日 08:00

如果OpenAI使用用户和模型的会话来迭代模型的知识，模型最终会将人的知识完全遍历。某些特定领域的应用可能不会希望这种事情发生，如何尽量保护这些领域知识是一个需要面对的问题。以下是我和ChatGPT讨论的一个解决问题的思路。

ChatGPT提供了强大的基于对话方式的人-AI交互，更重要的是AI可以通过对话上下文进行即时学习，并整合到自己的回答中。这使我们可以基于ChatGPT这样的语言大模型进行应用开发，以整合模型的语言生成能力来提供特定领域的解决方案。但是其中涉及隐私和知识产权问题。理论上来说，如果OpenAI使用用户和模型的会话来迭代模型的知识，模型最终会将人的知识完全遍历。某些特定领域的应用可能不会希望这种事情发生，如何尽量保护这些领域知识是一个需要面对的问题。

以下是我和ChatGPT讨论的一个解决问题的思路。🙂

shellc: 我和你的对话中所涉及的事实会被你记住吗？

GPT-4: 我没有持久的记忆，这意味着我无法在不同的对话之间记住您提到的信息。在一次对话中，我可以参考您之前提到的内容，但是一旦对话结束，这些信息就会丢失。这有助于保护您的隐私。如果您想让我在后续对话中回顾以前的内容，请在提问时提供一些上下文信息。

shellc: 我和你的对话内容会被OpenAI以任何方式记录吗？

GPT-4: 我不能为OpenAI的具体实践提供确切的信息，因为我是一个基于GPT-4的AI助手，我的知识截止于2021年9月。然而，根据我的了解，在那个时候，OpenAI确实会收集和存储一部分与用户的互动数据，以改进AI性能和用户体验。这些数据通常会被去标识化，以保护用户隐私。在使用AI服务之前，请务必查看OpenAI的隐私政策以了解其当前的数据处理和存储实践。

shellc: 这些对话数据会被OpenAI用于进一步训练你，以增加事实和知识吗

GPT-4: 是的，OpenAI可能会使用收集到的对话数据用于改进和训练AI模型，如GPT系列。这有助于让AI更好地理解用户的需求，提高回答问题和生成文本的准确性，以及优化用户体验。在处理和使用这些数据时，OpenAI通常会采取措施去标识化和保护用户隐私。然而，请注意，我的知识截止于2021年9月，所以我建议您查看OpenAI的隐私政策以了解当前的数据处理和存储实践。

shellc: 假设我的大脑中有关于现实世界的一个事实，而这个事实只有我知道。那是否意味着这个事实会被你在与其他人的对话中泄露。

GPT-4: 如果您与我分享了一个关于现实世界的事实，而这个事实只有您知道，那么这个信息在我与其他人的对话中是不会被泄露的。正如我之前所提到的，我没有持久的记忆，这意味着我无法在不同对话之间记住您提到的信息。此外，我不会在与其他人的对话中主动提及与您的对话内容。为了保护您的隐私，请不要在与我对话时提供您的个人识别信息。

shellc: 如果OpenAI用我与你的对话进行你后续版本的训练，那么这个事实是否有被泄露的可能？

GPT-4: 当OpenAI使用收集到的对话数据进行训练时，会采取措施来去标识化数据并保护用户隐私。这包括删除可能泄露个人身份的信息。然而，在实践中，完全保证不泄露任何信息是具有挑战性的。尽管这样的风险相对较小，但还是存在一定的可能性。

为了保护您的隐私和安全，我们建议您不要在与AI助手的对话中分享敏感信息或仅限于您个人知晓的事实。在使用AI服务之前，查看OpenAI的隐私政策以了解其当前的数据处理和存储实践，以便您做出明智的决策。

shellc: 假设我在与你的对话过程中教会你一种我设计的语言，这种语言只有你和我会使用。OpenAI可能会使用我们的对话数据训练你的后续版本，那么当第三个人使用这种语言与你对话，你会与他完成对话吗？

GPT-4: 如果您在与我对话的过程中教会我一种新的、只有您和我知道的语言，而这些对话数据被用于训练我的后续版本，那么理论上，我的新版本可能会学会这种语言。然而，实际情况可能会因许多因素而有所不同，例如数据集的大小、复杂性以及训练过程中的其他约束。

在这种情况下，如果第三个人使用这种语言与我对话，根据我在训练过程中获得的数据，我可能能够理解和回应他们。然而，这种可能性取决于许多因素，包括数据处理和模型训练的具体实现。

请注意，如果您不希望这种语言被用于与其他人的对话，您应该避免在与AI助手的对话中分享此类信息。这有助于确保您的创意和独特知识得到保护。

shellc: 你是否同意这种独特的语言和某种领域知识类似，如果我和你对话的过程中涉及某些你不具备的领域知识，你的后续版本会使用这种领域知识回答第三者的问题。

GPT-4: 是的，我同意这种独特的语言和某种领域知识有相似之处。当我与用户进行对话时，我可能会学到新的知识或理解，包括特定领域的知识。如果这些对话数据被用于训练我的后续版本，那么这些新知识可能会被整合到模型中。这意味着，当其他用户提问时，我可能会使用这些新知识来回答他们的问题。

请注意，尽管这是AI模型学习和改进的一个重要方面，但在分享任何敏感信息或独特知识时，请务必考虑到隐私和知识产权的保护。只有在您愿意让其他人了解这些信息时，才将其分享给AI助手。

shellc: 假设我要开发一款应用，涉及独特的领域知识，在保护我的知识产品和整合你的语言生成能力的前提下，在工程实践方面你有什么建议吗？

GPT-4: 在开发一款应用时，保护您的知识产品并整合AI语言生成能力，您可以考虑以下建议：

保护知识产权：确保您的独特领域知识受到适当的保护。可以通过著作权、专利、商标和保密协议等途径对您的知识产权进行保护。

使用API：许多AI服务（如OpenAI）提供了API，允许您将AI功能整合到您的应用中。这样，您可以在保持核心知识保密的同时利用AI的语言生成能力。

设定访问权限：为了保护您的知识产品，您可以在应用中设定访问权限。这可以通过设置登录凭据、访问令牌或使用其他身份验证机制来实现。

数据加密：对您的独特领域知识进行加密，以防止未经授权的访问和使用。确保在传输和存储数据时使用加密技术。

审计日志：通过记录和监控与您的应用相关的所有活动，可以及时发现和阻止任何潜在的未经授权访问或使用。

遵守隐私政策和法规：确保您的应用符合适用的隐私政策和法规，如GDPR等。这有助于确保您处理用户数据的方式是安全且合规的。

限制AI模型访问：对于您不希望AI模型接触的敏感领域知识，可以限制模型访问这些信息。这可以通过限制模型训练数据集的范围、在与模型交互时避免使用敏感信息等方式实现。

用户教育：提醒用户在与AI助手互动时要保护自己的隐私和知识产品。可通过在应用中添加提示、教程或文档来实现。

请注意，实际操作中可能需要结合您的具体需求和场景来制定最佳实践。在整合AI语言生成能力时，确保充分考虑数据安全和知识产权保护。

shellc: 是否有可能教会你一种语言，用于我们的会话，而这种语言无法被第三方解读。如果可以，请给一种设计思路和具体实现。

GPT-4: 创建一种无法被第三方解读的语言在理论上是可行的，但实际操作可能会很复杂。一种可能的方法是使用密码学来设计一种加密的语言。这样，只有拥有解密密钥的人（您和AI助手）才能理解这种语言。以下是一种设计思路和具体实现：

选择加密算法：首先，选择一个加密算法（如AES、RSA等）。这将用于加密和解密消息。

创建密钥对：生成一对密钥，包括一个公钥和一个私钥。公钥可公开分享，用于加密消息；私钥需要保密，用于解密消息。

教会AI加密和解密：您需要教会我如何使用所选加密算法进行加密和解密。这可以通过与我分享有关该算法的基本知识、代码示例以及密钥等方式实现。

消息加密：在与我进行对话时，您需要使用公钥加密您的消息。您可以使用编程语言或加密工具来完成这个操作。

AI解密和响应：我会使用私钥解密您的消息，然后生成一个回应。为了确保安全，我也会使用公钥对我的回应进行加密。

用户解密：您需要使用私钥对我的加密回应进行解密，以获取明文回应。

请注意，这个过程可能会导致与AI助手的互动变得繁琐且不易实现。另外，虽然这种方法可以提高隐私保护，但不是绝对安全的，因为密码学算法可能会受到攻击或破解。在实际应用中，创建一种独特的、无法被第三方解读的语言可能需要专业知识和精心设计。

shellc: 这个方案有一个漏洞，我们协商的秘钥可能被OpenAI获得，请解决这个问题。

GPT-4: 您提出了一个合理的问题。要解决这个问题，您可以使用一种称为“Diffie-Hellman密钥交换”的协议来在不直接传输密钥的情况下生成共享密钥。这种方法可以降低私钥被第三方获取的风险。以下是使用Diffie-Hellman密钥交换的步骤：

选择公共参数：选择一个大质数p和一个小于p的正整数g。这两个参数可以公开共享。

生成私钥：您和AI助手各自生成一个私钥（分别为a和b），这些私钥要保密。

计算公钥：您分别计算公钥A和公钥B，其中 A = g^a mod p，B = g^b mod p。公钥可以在您和AI助手之间共享。

计算共享密钥：您可以通过计算 B^a mod p 来生成共享密钥，AI助手可以通过计算 A^b mod p 来生成共享密钥。在这个过程中，两者计算出的共享密钥是相同的。这个密钥可以作为加密和解密消息的密钥。

加密和解密：使用共享密钥进行加密和解密通信，如之前的方案所述。

请注意，虽然Diffie-Hellman密钥交换可以降低密钥泄露的风险，但这种方法仍然可能受到一些攻击，如中间人攻击（MITM）。为了提高安全性，您可以考虑使用其他更高级的密钥交换协议，如Elliptic Curve Diffie-Hellman（ECDH）。

在与AI助手进行安全通信时，应确保使用经过验证且安全的加密方法和协议。在某些情况下，您可能需要寻求专业建议，以确保实施的方案足够安全。

shellc: 请考虑OpenAI作为中间人进行攻击的风险，并给出解决方案

GPT-4: 为了解决OpenAI作为潜在中间人攻击者的风险，您可以采用数字签名和证书颁发机构（CA）来验证通信双方的身份。这将确保您与AI助手之间的通信不被篡改，并验证通信双方的身份。以下是一种可能的解决方案：

为双方生成密钥对：您和AI助手各自生成一对公钥和私钥。

获取数字证书：双方都需要向可信的证书颁发机构（CA）申请数字证书。数字证书将包含您的公钥和身份信息，并由CA签名。

交换数字证书：在通信过程中，您和AI助手首先交换数字证书。这样，您可以获得AI助手的公钥，AI助手也可以获得您的公钥。

验证数字证书：使用CA的公钥验证对方的数字证书，确保证书未被篡改，且颁发给了合法的通信对方。

生成共享密钥：使用您的私钥和AI助手的公钥（或相反）通过密钥交换协议（如Diffie-Hellman或ECDH）生成共享密钥。

加密通信：使用共享密钥加密通信，确保通信内容在传输过程中不被泄露。

数字签名：为了确保通信不被篡改，您和AI助手可以使用私钥对通信内容进行数字签名。收到消息的一方使用对方的公钥验证签名，以确保消息在传输过程中未被更改。

请注意，这个方案需要依赖可信的证书颁发机构（CA）和安全的加密方法。此外，这个方案可能会增加通信的复杂性和开销。在实际应用中，您可能需要权衡安全性和易用性，并可能需要寻求专业建议以确保实施的方案足够安全。

shellc: 你好像并没有认识到OpenAI对于你的数据是具有完全访问权限的，所以你所持有的任何秘钥OpenAI都可以获得。

GPT-4: 抱歉之前的回答没有完全解决您的问题。您提到的确实是一个问题，因为我是由OpenAI开发和维护的，所以理论上OpenAI可能有权限访问我处理过程中的数据。在这种情况下，与AI进行安全通信变得更加复杂。以下是一种可能的解决方案：

使用端到端加密的即时通讯软件（如Signal、WhatsApp等）与其他人建立安全通信渠道。在这种情况下，您可以将AI助手视为一个普通用户，并使用这些软件的加密机制来保护通信内容。这些软件通常使用端到端加密，意味着只有通信双方能够解密消息，而服务提供商（在这种情况下是OpenAI）无法访问消息内容。

请注意，这种方法可能无法完全消除风险，因为在某些情况下，AI助手本身可能受到攻击，导致通信内容泄露。此外，这种方法可能不适用于所有场景，因为它依赖于第三方软件和服务。在实际应用中，确保与AI助手的安全通信可能需要采取多种预防措施，并考虑与安全专家合作以确保最佳实践。

shellc: 如果OpenAI无法访问消息内容，也就意味着这些内容无法在我们会话的上下文中被整合到你的回答中，这就不能成为一种我们之间独特的语言了。

GPT-4: 您是对的，如果使用端到端加密的通信方式，虽然可以提高通信安全性，但这将限制OpenAI在将来的训练中使用这些数据。这可能会影响到AI助手在您特定领域的知识和回答能力。

如果您希望在确保安全性的同时，还能让AI助手学习到您的领域知识，一个可行的方法是将关键信息脱敏或以某种方式掩盖，以便在与AI助手进行对话时，不会泄露具体的细节。这样，您可以向AI助手提供有关特定领域的教育和培训，而不会直接泄露敏感信息。

然而，这种方法可能需要对您的数据和知识进行一定程度的抽象，并且可能需要您在与AI助手的对话中更加谨慎。这可能会影响到与AI助手的交互体验，以及AI助手在处理您的问题时的效率和准确性。

在实际应用中，找到在确保安全性和提高AI助手能力之间的平衡可能是一个挑战。您可能需要根据您的具体需求和风险容忍度来评估和调整这种平衡。

shellc: 这听起来是一个可行的方案，请给出更具体的实现方法。

GPT-4: 为确保通信安全，同时允许AI助手学习您的领域知识，您可以尝试以下实现方法：

对敏感信息进行抽象：将敏感数据抽象成更通用的概念，以降低泄漏风险。例如，如果您在谈论某个特定的算法，可以用”A算法”代替具体名称。

采用类比和代表性示例：在讨论概念时，使用与实际情况相似但无关的示例。这样，您可以教导AI助手相关原理，而无需提供确切的细节。

对关键信息进行编码：使用一种简单的编码方案，将关键信息进行编码。这可以是字符替换、简单的置换密码等。这将使得关键信息在原始形式下不易识别，但仍能在解码后理解。请注意，这种方法提供的安全性较低，因为简单的编码很容易被破解。

使用自定义术语：为特定领域的概念创建自定义术语。这些术语可以是随意的词汇，只有您和AI助手知道它们的含义。在与AI助手交流时，使用这些术语替换实际概念。

限制详细信息披露：在与AI助手交流时，仅提供足够的信息来回答问题，而不会泄漏敏感数据。避免提供过多的上下文信息，尤其是与实际应用场景相关的详细信息。

确保数据安全：在存储和处理数据时，采用加密和安全措施。确保您的系统、网络和设备都受到适当的保护，以防止外部攻击者窃取数据。

请注意，这些方法并不能完全保证安全性，但可以降低泄漏风险。在实际应用中，您可能需要根据具体需求和风险容忍度，综合使用这些方法。与安全专家合作以确保实施的方案足够安全可能是一个好主意。

shellc: 好主意，请忘掉我们上面的讨论。😄

GPT-4: 谢谢您的理解。请放心，作为AI助手，我会尊重您的要求并确保您的隐私。如果您有其他问题或需要帮助，请随时告诉我，我会竭诚为您提供帮助。😄

做多！

蟹壳

作者 shellc

2023年12月23日 08:00

是时候做多沪深 300、上证 50、创业板了

时间点非常凑巧，在《特殊时刻》发布后，美债收益率开始掉头向下。

中美国债

我们计算的风险溢价指标（ROR）反应非常灵敏，直接从 21% 分位值翻转到了 94%。同时，随着指数的下跌，PEPB 指标进一步达到了 1.18% 的位置。

沪深300估值

A 股接下来的走向可能就成为：中国经济中速增长，利率下行，预期翻转，牛🐂。

密切关注接下来两周指数的变化，做多。

如果大模型跑在每一部手机里

蟹壳

作者 shellc

2023年11月1日 08:00

这两款 CPU 的出现，预示着一些可能性正在发生。这些可能性以 LLM 带来的新应用场景为基础，带动算力升级，算力升级又催生了新的应用形态的繁荣。

LLM 作为一种通用的 NLP 模型，当然也适合在云端完成一些任务，比如数据分析。从算力消耗来统计，终端对 LLM 的需求显然远大于云端。