难道说?我感觉他们能做出来强制 kyc 才让用这种操作 https://twitter.com/op7418/status/2064260089385713841/photo/1
MiMo推出1000 Token/s超高速模型|体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本,能够实现每秒输出超过 1,000 Token 的速度。 同时,这应该也是全球第一个达到这个速度的万亿(1T)参数模型。 藏师傅提前试了一下,做了三个测试,确实爽。 第一个跑了一个比较复杂的 3D… https://twitter.com/op7418/status/2064257622803710463/video/1
Open AI 也开始正式启动上市的法律和监管程序,但是他们说 IPO 时间还不确定 https://twitter.com/op7418/status/2064194929421865300/photo/1
昨晚苹果 WWDC 唯一的亮点就是这个灵动岛的新 Siri AI 了。 而且本地端侧模型居然只支持 17Pro 这一款设备,当然欧洲和中国还是不可用。 https://x.com/alexwidua/status/2064057649940119933/video/1
昨晚苹果 WWDC 唯一的亮点就是这个灵动岛的新 Siri AI 了。 而且本地端侧模型居然只支持 17Pro 这一款设备,当然欧美和中国还是不可用。 https://x.com/alexwidua/status/2064057649940119933/video/1
苹果的做设计现在也是面多了加水,水多了加面。 iOS 27 又把磨砂效果加回来了,而且你能把磨砂效果调到满。跟之前的没啥区别, 液态玻璃效果完全没了。 侧边栏从卡片又改回了原来的那个填满的效果
提醒一下今晚一点有 WWDC 哦
最近可以在各种媒体和账号上,看到我的那个 Skills 推荐。感谢量子位。 https://twitter.com/op7418/status/2063991326132383988/photo/1
转一下笑林老师关于设计工程师定义,想找类似工作的可以看看
微信终于要加 AI Agent 能力了? 微信发布了《开发者接入微信 AI 生态的指引》这篇文章,引导小程序开发者接入微信 AI 生态,让微信的 AI 控制小程序。 感觉这个可能是未来微信 AI 上一个非常重要的功能 https://twitter.com/op7418/status/2063900613990371759/photo/1
试了一下,公众号图文卡片也是支持 Live Photo 的。 只不过要从 iPhone 上上传,这下爽了呀!
藏师傅的社交媒体卡片 Skill,即将迎来一个非常重磅的升级。 可以帮大家解决小红书 Live Photo 的制作问题,同时会帮你制作动态的带文字排版的 Live Photo 这样你可以在发布一些必须的动态内容的时候,依然以图文的形式发布,而不至于做非常重的视频。 https://twitter.com/op7418/status/2063883141287399589/photo/1
Anthropic 的员工离职还是比较少见的,尤其是 IPO 前离职
也是没招了,Notion直接点名 Anthropic Opus 4.7 和 Opus 4.8 模型性能下降的问题。 他们也澄清了,说都会存在这种问题,目前性能下降问题已经恢复。 但是 Anthropic 这个模型出问题的概率真是比其他两家高非常多。 我截了一下这三家的状态页面,Anthropic 甚至连 99% 的可用性都保不住。 https://twitter.com/op7418/status/2063862596764348576/photo/1
北京这几天的天气是真的好 https://twitter.com/op7418/status/2063161575410893268/photo/1
这个点子好,在朋友或者是父母的电脑上装个 codex。 然后开启远程控制,你就能帮他们修电脑了,而且也可以帮用 computer use 去控制他们的电脑。 https://twitter.com/op7418/status/2063154662417866900/photo/1
Codex 个人资料页的这个 Token 消耗数据可以分享了。 这个分享图做得真挺好的,打开设置、个人资料页,点击右上角的分享图标,就可以生成分享图了 https://twitter.com/op7418/status/2062922085748621464/photo/1
啊?咋就抖音精选了 https://twitter.com/op7418/status/2062864675658977349/photo/1
发现有些朋友在用 GitHub 的时候,什么发言啊什么的,什么原生啊,看得老重了。 但是就是不知道看那个版权协议。 注意哦,这个 PPT skill 的版权求必须署名并且开源。如果不想开源的话,联系我走商业授权。 就是抄点子也就算了,直接抄代码,还有的直接抄名字。
在 AI Vibe Coding 开发过程中,文档基本上等于 Harness,也就是说文档体系就是 Harness,其他都是不重要的,或者没那么重要
事实上,Codepilot 这种大型代码库 Vibe Coding 非常依赖于文档。 自从 Claude Code 的 Plan 模式废掉以后,我连计划写的都是计划文档,整个文档体系的复杂度和占代码的比例都在快速大幅上升。 所以,文档体系的管理,以及 AI 和人协作下的文档梳理,在整个大型代码库中其实是非常重要的。 我让… https://twitter.com/op7418/status/2062732151515455637/photo/1
CodePilot v0.55.0 正式版已经更新! 重构完成的正式版: 多执行引擎(Claude Code / 自建 Native / OpenAI Codex)、上下文用量可视化、Codex 账号原生能力全部落地为稳定版,并集中修复了 macOS 视觉与托盘、Windows 安装与交互、服务商型号映射等内测反馈问题。 🆕新增功能… https://twitter.com/op7418/status/2062567442568933720/photo/1
即览的新版已经上传,各位可以去 TestFlight 里面更新新版了。 本次更新内容: 1. 修复了一堆 Bug 2. 同时支持了 iOS 17 和 iOS 18 系统 https://twitter.com/op7418/status/2062563287225733565/photo/1
说一下 guizang PPT Skills 还会继续更新啊。 得益于最近的几个赞助,可以找时间去更新第三套主题了,依旧非常惊艳。 同时,在小红书那个图文卡片部分积累的好经验,也会用到 PPT Skills 的新版里面。
又发现一个 Codex 好用的点! 我发这个视频,抖音说我违规,我实在不知道哪句话违规了。 然后就让 Codex 直接根据我的视频和我的字幕,帮我视频剪一个不违规的版本,牛逼,果然过审了。 https://twitter.com/op7418/status/2062403614963126712/photo/1
做了个简单的小工具 即览 Glimpse 没有 AI,不联网,专注于解决手机上的 Markdown 和 HTML 的 AI 产出物预览问题。 ​ ​苹果审核卡了我三天,开放了 8000 个测试名额,应该够了。如果满了的话,可能等几天我就上架了 https://twitter.com/op7418/status/2062392105860059227/video/1
哎呀,我怎么就放了 8000 个测试,一下就没了呢? 我也在加紧提交正式版审核哈,到时候我就直接上架了。直接上架的话,大家都能下载、都能用了。 现在最多只能开 1 万个测试,目前已经 8000 了,名额快没了。没用上的朋友们再等等,安卓版我也在做了啊。
https://x.com/i/article/2062359856376610816
Reve 2.0 这个图像模型强啊 原生 4K 输出,主要是它支持类似于你在 PS 里用到的图像分层之后的编辑能力就。 图像中的每一个部分,你点它就能选中。而且这个不需要中间的处理,他给你处理好了。就是你想要编辑哪个部分,就点哪个部分 https://x.com/reve/status/2062260665121919101/video/1
看来快手确实要分拆可灵单独上市了了。 其实早就该搞,太晚了现在。 https://twitter.com/op7418/status/2062062986903359546/photo/1
公网发布内容不只是国内麻烦,海外也麻烦。 之前 OpenAI 在公网分享聊天生成的网页的能力就被下了,因为很多人拿那个去做 SEO,里面全是广告,搞得乱七八糟,所以 OpenAI 就给下了。 这次这个能力不开放给外部普通个人用户,应该也有这方面的考虑。
Codex 昨晚上线的这个 Site 插件非常厉害。 它本质上感觉类似于 Claude Design,帮你设计和生成网页,同时还帮你部署好了,可以直接给别人访问。 比较遗憾的是 Pro 用户不能用,只有那些 Business 和有组织的用户可以用。https://x.com/TheRohanVarma/status/2061872164442403139/video/1
Hermes 居然出官方的客户端了,感觉他们的发展比龙虾好太多了 https://x.com/NousResearch/status/2061843507417944552/video/1
小红书一个月涨了一万粉,离谱啊,现在三万了 https://twitter.com/op7418/status/2061786484341182591/photo/1
收到了 @dotey 宝玉老师的图解 Skill,已严肃阅读 里面的配图都很有意思,非常适合理解内容,要是对 Skill 学习有需求可以看看 https://twitter.com/op7418/status/2061772644215832828/photo/1
感谢 360 安全龙虾成为“歸藏 PPT Skill”的金牌赞助商! 我一直在想找一个可持续的方案来更新 PPT Skills,因为更新主题实在太费人力了。 基本上是我一个人在一页一页地调,非常耗时间。所以我开始引入赞助商。 目前产品依然是开源的,赞助商那边会同步更新,我也会帮忙做一些小的适配工作。… https://twitter.com/op7418/status/2061754975685108020/photo/1
Anthropic 开始准备 IPO 了。 MiniMax 和智谱也同时提交了上 A 股和科创板的申请,同时开始进行上市指导。 大家都有光明的未来,不知道 OpenAI 啥时候开始。 https://twitter.com/op7418/status/2061645513964003631/photo/1
苹果:北京时间 6 月 9 日凌晨 1 点举行 WWDC26。 这次的视觉设计挺漂亮的,他们还顺手发布了三张 iPad、iPhone 和 Mac 的壁纸放在这儿了。 点击加载 4K就行,也可以去下面网站下 6K 原图。 https://twitter.com/op7418/status/2061644847325610329/photo/1
其实都搞好了,被苹果审核卡脖子了 https://twitter.com/op7418/status/2061456989969133796/photo/1
Codepilot 的重构版本终于好了! CodePilot 0.55.0-preview.5 相当多的内容优化,UI 整体重构,支持将 Codex 作为 Agent 引擎 可以使用 Codex 内置模型也可以自定义模型 目前是测试版本没有推送,不排除有大 bug,如果有问题欢迎带日志反馈 https://twitter.com/op7418/status/2061426771267125649/photo/1
谁能想到藏师傅有天也能上央视新闻呢 https://twitter.com/op7418/status/2061336925286629879/photo/1
妈的,终于搞定我的 Codex 断联和推理慢的问题了! 我有一台电脑上的 Codex 推理速度巨慢,即使开了快速模式也很慢,还有一个问题就是经常连不上。 我一直以为是自己的网络有问题,但它和我的 Mac Studio 处于同一个网络环境,Mac Studio 运行就非常快。 结果今天发现,是我的 config…
MiniMax 这次终于发布了他们的大版本号模型升级 MiniMax M3。 主要是三个核心能力: 1. 标配了 1M 的超长上下文 2. 采用新的 MSA(MoE with Segment-wise Attention)稀疏注意力架构 3. 从训练起就融合了原生多模态能力,包括强化了文本、图片、视频和桌面操作这些多模态的训练。 MSA… https://twitter.com/op7418/status/2061327301644861608/photo/1
我的 iOS Markdown 和 HTML 文件阅读 APP 即览差不多了 没想到一些视觉样式调整了一天时间,明天发个表单让大家参与测试 https://twitter.com/op7418/status/2061120486038450317/photo/1
终于搞定了焖面 https://twitter.com/op7418/status/2061033637538414594/photo/1
iOS 上我做的那个 HTML 和 Markdown 预览的 App (即览)差不多了,感觉晚上就能给大家发测试资格了 https://twitter.com/op7418/status/2060689179642916894/video/1
我去,太牛批了! 我的 Skill 冲到 GitHub 本周新建项目 Star 排名第一了! 就是这个社交媒体卡片 Skill (guizang-social-card-skill) 还是刚才一个群友让他的 Agent 找项目的时候发现的。我自己看了一下,果然是第一! https://twitter.com/op7418/status/2060667214077034978/photo/1
说干就干朋友们,开新坑了 https://twitter.com/op7418/status/2060639508002148578/photo/1
现在周围人发文件都变成 Markdown 和 HTML 了,但是微信这俩格式一个都不支持,而且相当封闭,想用其他应用打开都费劲,真是受不了。 如果是在外面用手机,别人发过来的 Markdown 和 HTML 文件都不知道怎么打开。 感觉得做个手机上的 HTML 和 Markdown 阅读器了。
把自己之前的 M3 MacBook Pro 换成了 M5 的 MacBook Air。 主要是由于原来的是 512G 的内存,随着我自己开始录视频,这个内存就捉襟见肘。 而且确实用不到那么高的性能,有了一个 Mac Studio 了。 换了个 32G 两 T 的版本,京东加上国补才 1 万 5。要是同样内存的话,Pro 感觉得两万七八。 https://twitter.com/op7418/status/2060613231668801789/photo/1
我在想藏师傅的这种东西是不是绝佳的前端训练数据可以造非常多
Windows 有救了? Codex 昨晚又发布了大量体验更新,很多都超级有用,尤其是对 Windows 用户。 大家最期待的支持了 Windows 的 computer Use,以及通过移动端的 ChatGPT 远程控制 Windows 上的 Codex。 但是 Windows 上的 Computer Use,在它控制的时候你是不能控制的。这跟 Mac 上的不太一样。… https://twitter.com/op7418/status/2060549911960293704/video/1
Windows 有救了? Codex 昨晚又发布了大量体验更新,很多都超级有用,尤其是对 Windows 用户。 大家最期待的支持了 Windows 的 computer Use,以及通过移动端的 ChatGPT 远程控制 Windows 上的 Codex。 但是 Windows 上的 Computer Use,在它控制的时候你是不能控制的。这跟 Mac 上的不太一样。…
Windows 有救了? Codex 昨晚又发布了大量体验更新,很多都超级有用,尤其是对 Windows 用户。 大家最期待的支持了 Windows 的 computer Use,以及通过移动端的 ChatGPT 远程控制 Windows 上的 Codex。 但是 Windows 上的 Computer Use,在它控制的时候你是不能控制的。这跟 Mac 上的不太一样。… https://twitter.com/op7418/status/2060548917750816913/video/1
有了 Claude Code 和 Cursor 这种软件以后,真的不只是写代码厉害。 我之前拿到豆包手机以后,想给它装个谷歌框架,但一直在 Google Play 那有点问题,死活装不上。 今天突然想起来,打开让 Claude Code 帮我装。 打开 USB 调试模式后,它直接就帮我搞定了:自动下载安装包、自动安装、自动调试好…
Cursor 发布了一份开发者报告,里面有些数据很有意思 挑几个比较重要的点来说: 头部用户的 AI 代码产出、token 消耗、PR 合并量都远高于中位数,而且差距还在扩大。 AI 写代码前读得越来越多,input/output token ratio 大幅上升。真正贵是理解一个代码库和任务。 缓存变得非常重要,如果每次… https://twitter.com/op7418/status/2060316035790860754/photo/1
Agent 就是 3D 打印机,Token 就是虚拟世界 3D 打印机的 PLA 材料 它是通用的,但最后打印出来的东西都不一样。
笑死,这都行
已经刷到好几个拿藏师傅的 PPT Skills 和小红书配图 Skills 做出千赞内容的小红书的博主了 说明这玩意儿确实有用。 你们再发的话可以艾特一下我,我还得给你们点点赞 https://twitter.com/op7418/status/2060192275301642532/photo/1
相较于 Opus 4.8,昨晚动态工作流(Dynamic Workflows)的发布,我感觉意义更重大一些。 它延续了那套并发的 Subagent 逻辑,但启动的 Subagent 可能多达数百个,能帮你完成一些非常重、规模非常大的任务。比如: 1. 调研你整个代码库的问题 2. 快速收集并生成一份庞大的调研报告… https://twitter.com/op7418/status/2060186234518184286/photo/1
相较于 Open 4.8,昨晚动态工作流(Dynamic Workflows)的发布,我感觉意义更重大一些。 它延续了那套并发的 Subagent 逻辑,但启动的 Subagent 可能多达数百个,能帮你完成一些非常重、规模非常大的任务。比如: 1. 调研你整个代码库的问题 2. 快速收集并生成一份庞大的调研报告… https://twitter.com/op7418/status/2060185927151174100/photo/1
没想到 Opus4.8 这就发布了,所有能力相较于 4.7 都有提升。 比较重要的是他在发现自己问题的能力上相较于 4.7 提升非常多,原来的话你让他自己 review 自己的代码基本没用。 https://twitter.com/op7418/status/2060170152474534183/photo/1
买了 M5Stack 的这个新玩具,还挺好玩的。 (a) 圆形彩屏,刷新率比较高,不是墨水屏 (b) 支持触屏,配有三个按钮 (c) 能播放声音,有震动功能 (d) 支持磁吸,完全可以吸在手机后边 除了比 OPPO 新发的那个厚一点,其他地方应该差不多;质感虽然没有 OPPO 的好,但它便宜。… https://twitter.com/op7418/status/2059988012671607251/video/1
推特这个自动翻译实装了,效果不错 应该是这几家国际化内容平台里唯一一个全量自动化翻译的 很难想象AI 发达了这些内容和社交软件各个语言用户沟通和内容消费依然这么困难 https://twitter.com/op7418/status/2059917145702871401/photo/1
藏师傅的 PPT Skills 和小红书图文排版 Skill,已经通过这几天的发酵证明了巨大的商业价值。 如果有哪些 Agent 或者 AI 平台需要商用授权、集成到自己产品里的,可以联系藏师傅哈。 除了商用授权以外,我也会帮你在你的产品里把这个效果调整到最好。 https://twitter.com/op7418/status/2059845909245255965/photo/1
来了!这次的小红书图片生成器 Skill 效果太好了 我都没想到他能够这么顶, 这次在图文混排上下了非常大功夫 2 套主题、28 个版式、9 套配色、8 大小红书主流内容类别适配 如果你自己有非常漂亮的图片,那么它就会凸显你的图片。 如果你没有图片,它会帮你找很牛逼的图片。… https://twitter.com/op7418/status/2059837199299031265/video/1
https://x.com/i/article/2059811469081141248
guizang-social-card-skill 按照小红书的图文常见类别,每个类别都做了优化。 比如说旅行博主需要的地图组件,已经放进去了 你给了目的地和线路以后,AI 会自动在底图上标记,嵌入到图片里面。 https://twitter.com/op7418/status/2059587983289016348/photo/1
不是都十年了还能有新 DLC 啊? 不知道到底有多大体量,应该是为了补齐《巫师4》的一些设定或者是内容? https://twitter.com/op7418/status/2059577692513841477/photo/1
OpenRouter 获得 1.3 亿美元的 B 轮融资 感觉这个估值有点低了,这种聚合 API 后面应该是新的 Token 经济的基础平台
Qwen 3.7 Max 在 Arena Coding Agent 上排第四 https://twitter.com/op7418/status/2059472466666455144/photo/1
MiniMax M3模型要上了,好久没发新模型了他们
我去,小米 MiMo API大幅降价 2.5 Pro 输入降价幅度高达 99%!输出也有80%! 而且Token plan 额度也大幅提升,相较以前多了5-8倍。 同时重置了所有人的额度。 https://twitter.com/op7418/status/2059437482748637513/photo/1
笑死 3:4 这比例一上真成杂志了 https://twitter.com/op7418/status/2059258742831784053/photo/1
藏师傅的小红书 Skill,当然你如果提供的图片本身质量高的话 AI 会选择这种侵入性比较低的排版方式,突出你的图片质量。 在旅行和美妆以及别的这种看图片质量的情况下,效果比较好。 https://twitter.com/op7418/status/2059230887561060539/photo/1
日活跃粉丝比例是 56%,挺高啊 https://twitter.com/op7418/status/2059198510105514327/photo/1
藏师傅的小红书图文排版 Skill 预览 完全靠 HTML 和实拍图片,不会被标注 AI AI 会去高质量图片网站帮你寻找对应的主题图片,让你的图文告别只有生硬文字的尴尬情况 https://twitter.com/op7418/status/2059176154125480426/photo/1
我去 Krea 卷起来了? 这周他们的 Pro、Max 和 Business 会员 Seedance 2.0 无限用 https://twitter.com/op7418/status/2059096803212153202/photo/1
内饰🐂🍺,但这个外观属实都完全看不出法拉利设计语言了
藏师傅的小红、小绿书组图生成器 Skill 配合 Codex 太好用了! 我给他一张三张拼在一起的图,它自动加进去的时候,我并没有指定位置,它就能自动根据图片内容匹配对应的页数。 而且虽然这三张图是拼在一起的,它在下面还用分开的格子进行了标注,内容都能对上,太省心了。 https://twitter.com/op7418/status/2059093924996960308/photo/1
不吵架了,预告一下下一个 Skill 项目 基于 PPT Skill 可以帮你一键生成微信公众号和小红书封面 也可以基于文档生成小绿书和小红书图文所需的 3:4 组图 会自动处理你的截图素材,自动进行匹配 https://twitter.com/op7418/status/2058925029203882187/photo/1
Twitter 官方开始打击这种程序化的内容搬运,有些喜欢抄东西不转发的,可以准备好了。 https://twitter.com/op7418/status/2058806244295774350/photo/1
还有这东西原来,感谢正常标注事实的朋友们
刚好说起这事来了,顺便说一下推特上应该怎么转发别人的内容。 如果你想做大,想做国际化的话,可以看看。毕竟海外的一些人,他不惯着你。 如果说有原文,你最好是转发。然后呢你可以截他的原文在你的转发的推文上,这个一般大家是不会说你的。…
看了 Max 这条内容,我才知道这几天发生了这么多事。这行业里门道这么多吗?我一个 10 万粉小卡拉米也配当大 V 了?
我看这事发酵的挺大,我说一下。就是冒用截图就是不对的,无论你是从哪拿到的截图,对吧? 然后正主找上门来了,说你冒用,或者人家不喜欢。首先做的什么事呢?道歉。然后呢,把原内容删掉,在自己的内容上发一个澄清的帖子。 这个事大部分都能接过去,没有什么问题。…
Codex 又重置了
都在推特上,你拿我图还给我打个码,没必要吧?
M5 Stack 新出的 Paper Color 彩色墨水屏也做了适配 https://twitter.com/op7418/status/2058098200716992890/photo/1
新版 Codepilot https://twitter.com/op7418/status/2058095052715630705/photo/1
哈哈,新设备来了,这玩意有麦克风和扬声器,那可玩性可就强多了! 最近疯狂在 M5 Stack 家消费,他家出个新的就断货 https://twitter.com/op7418/status/2057783822893318277/photo/1
哈哈,太好玩了!藏师傅做了个 AI 屏幕便签纸 Skill。 让 AI 根据你当前的状态和记忆,在墨水屏上显示内容,支持十几种常见组件。 之后你不再切 calendar、不再翻 GitHub tab——AI 主动把它觉得你该看的事推到墨水屏上。 16 种 widget 自由组合,2-1-1 布局拆 4 个槽位。瞥一眼就够。 https://twitter.com/op7418/status/2057778107617292310/video/1
https://x.com/i/article/2057775296712196096
最近好像 Claude Code 连接飞书又火了 再推荐一下藏师傅两个多月前写的这个 Skills 哈。 它能连接 Telegram、飞书、QQ、微信、Discord 等各种 IM,支持 Claude Code 和 Codex。 https://twitter.com/op7418/status/2057756179363995755/photo/1
很难想象现在这个 AI 产品的宣发手段。 腾讯的这个 Mavis 居然靠它这个非常魔性的界面交互出圈了。 今天打开抖音之类的,全是在发这个界面的,什么喝咖啡的、跑步的。 https://twitter.com/op7418/status/2057737525863866584/photo/1
小红书可以直接上传 Skill 了,这个太屌了,感觉是个很大的事件。 https://twitter.com/op7418/status/2057711810728559034/photo/1
完全体 https://twitter.com/op7418/status/2057696111360651724/photo/1
对了! 这条内容所有的这种 3:4 的介绍图片,都是用藏师傅的 PPT Skills 一键直出的
时间到了 Claude 又炸了 https://twitter.com/op7418/status/2057680792013394036/photo/1
Codex 昨晚发布史诗级更新,体验爆炸提升! 其中快捷截图添加上下文和内置浏览器高级注释的功能太有用了。 你只需要同时按住左边和右边的 Command 键,它就会把你当前鼠标所在位置的窗口全部截下来,然后自动填入到 Codex 的输入框里。… https://twitter.com/op7418/status/2057678002675413057/photo/1
剪映海外版宣布跟 Gemini 合作了 未来可以在这边里使用剪映的编辑功能去编辑图像视频,但是没有说具体的合作方式和上线时间
现在手上项目老多了: 1. Code Pilot 的重构马上就要完成了 2. 墨水屏的 Skills,应该今天或明天就能完成 3. 还有一个基于 PPT Skills 的项目,是通过 HTML 变成视频的这个 Skill 还在进行中 4. 基于 PPT Skills 生成小红书、微信图文封面的功能,也在进行中 5. PPT Skills 的第三个主题也在进行中
这个会打包成 Skill,任何 Agent 都能控制里面显示什么。 可以通过配合定时任务去定期刷新里面的信息和数据,配合磁吸把它吸在你的屏幕边,就是一个常态化的看板。 关机休眠的时候会展示你的介绍信息和二维码,这样你外出就直接可以加好友 https://twitter.com/op7418/status/2057321749575020799/photo/1
用了几天 Mac 版豆包输入法,已经离不开了。 准确性、中英文混合输入、专业名词的识别,响应速度,都是市面上最顶的。 我现在手机上已经离不开豆包输入法了,一直在等待桌面端上线。前几天发现 MacOS 版终于来了,赶紧下载试了一下。 我觉得表现最好的就是多语言混合输入。… https://twitter.com/op7418/status/2057123946039058618/photo/1
终于找到了这种墨水屏硬件最适合的场景: 开机的时候,让 AI 往里边推一个 To-do、日历,一些基础的需要记的信息 把它挂在屏幕边上(用磁吸) 关机的时候,利用墨水屏的特性让它显示名片,这样大家加好友什么的直接看就行 太实用了! 到时候打包成 Skills。有类似硬件的朋友到时候可以玩玩。 https://twitter.com/op7418/status/2057115669100216826/photo/1
天天玩 AI,去央美毕业展看点古法绘画 https://twitter.com/op7418/status/2057026266818105370/photo/1
虽然没能去到谷歌 I/O 大会的现场,但是收到了谷歌这次大会的伴手礼,感谢谷歌和微博 谷歌还是工程师文化重啊,送的这个伴手礼里边的小东西每个都很实用,数据线、支架之类的,感觉都能用上 https://twitter.com/op7418/status/2056958833474646253/photo/1
Codex 不语,只是一味重置额度 https://twitter.com/op7418/status/2056943517658911013/photo/1
谷歌 Genie 3 这个新功能很有意思 可以选择美国谷歌街景的任何一个地点作为首帧图片,然后生成 Google Genie 3 可互动的世界。 比如非常知名的黄石公园啊,城市之类的地方,然后你就可以进去游览了,代入感很强 而且你可以对这个街景的内容做风格化,比如:变成海底世界、末日后的世界之类的 https://twitter.com/op7418/status/2056931266038239274/video/1
AI Studio 昨晚更新主要有两个: 1. 支持从 Google Docs 和 Google Sheets 里面拉数据。你可以把谷歌表格直接作为开发应用的数据库。 2. 支持在网页里开发安卓应用程序。 我试了一下,这个 3.1 Pro 的安卓开发水平确实不如前端。 但更吊的是,它在 Studio 里塞了一个安卓模拟器,我去,太离谱了! https://twitter.com/op7418/status/2056913908489937395/photo/1
昨天谷歌 I/O 大会在编程上的动作,主要是把 Antigravit 的整个生态整合了。 Gemini 的 CLI 现在也叫 Antigravit CLI,还发布了对应的 SDK。 Antigravit 这个软件本身也迭代到了 2.0 版本,现在更像 Codex,而不像原来的 Cursor。 我大概试了一下。 用我的 PPT Skills 和一个文档测试了 Gemini 3.5… https://twitter.com/op7418/status/2056904254175281353/photo/1
谷歌 Gemini Omni Flash 视频编辑测试。 你们应该能猜到我原始视频是在哪儿录的,反正效果远不如 SeeDance 2.0 https://twitter.com/op7418/status/2056764456311664786/video/1
哇! 谷歌新视频模型 Gemini Omni Flash 已经上线 FLow https://twitter.com/op7418/status/2056758486755844494/photo/1
我去 Karpathy 居然加入了 Anthropic,这下估计没有教程看了,啥也不会说了,希望还能多分享 https://twitter.com/op7418/status/2056754653380124925/photo/1
谷歌新的视频模型 Gemini Omni 已经开始放量了
AI Studio 的移动端要上线了,现在谷歌 Play 可以预注册,看起来终于不用忍受 Gemini 了。 https://twitter.com/op7418/status/2056696844013773024/photo/1
藏师傅的 PPT Skill 突破 1 万 Star 了! 刚才才发现,藏师傅的 PPT Skills 已经马上要突破 10,000 Star 了,就差20个,今天应该就能突破。 我现在提前开香槟了! 这是我 vibe coding 以来第一个突破 10,000 Star 的项目。 在市面上已经有如此多 PPT 生成 Skills 的情况下,它依然仅用了 25… https://twitter.com/op7418/status/2056658831221080255/photo/1
Gemini 的 iOS 应用改版了,不得不说,谷歌的 iOS 开发水平确实比他们的网页和客户端高一大截。 整体的质感、细节都非常好,而且对于 iOS 液态玻璃的应用也很好。 就是完全没有为中文、日文和韩文这些语言做排版的适配,那个 live 里边的中文感觉字和字之间有空格,这太蛋疼了。 https://twitter.com/op7418/status/2056609161287458913/photo/1
哇!Gemini 网页版大改版了,整体布局跟 GPT 真像啊 之前的那堆功能都收到了加号里面。左侧的字体和间距都变小了,展示内容更多了 聊天的页面背景变成了灰色,感觉辨识度下降了,可读性比原来差我觉得。 https://twitter.com/op7418/status/2056584513086730281/photo/1
CodePilot 令我非常震惊的一个点是,最近因为我用它做 PPT Skills 做的比较多,它把我的风格喜好记下来了。 然后它改掉了生成式 UI widget 里面的视觉样式。 开始用我最喜欢的视觉风格来为我生成可视化的内容解释,这个太顶了! 看一下这三个图,太漂亮了! https://twitter.com/op7418/status/2056575632738553928/photo/1
藏师傅这个通过前端生成讲解视频的 Skill 其实已经搞完了。 但是还是想优化一下效果,提高一下工程化,以及降低一下 Token 的用量。 所以我让 Claude Code 跑了一个 40 秒钟的案例,然后让他对其中的 Token 进行了一下分析,看一下哪边占比比较多,然后再进行针对性的优化。… https://twitter.com/op7418/status/2056575297810751506/photo/1
🐂🐸 恭喜橘子
Lovable 终于支持 Skill 了,他们实在太慢了 如果要用你已有的 Skill 需要将 Skill 变成压缩包上传 https://x.com/Lovable/status/2056389416768414123/video/1
英伟达开始交付自己设计的通用 CPU NVIDIA Vera了。 重点优化的是长期高并发和高吞吐的场景,专门用来做Agent 编排和工具调用的中枢。 模型可以在 GPU 上进行推理,但所有的调度编排和调用工具都放在这个 CPU 上。 这种密集 Agent、密集常驻的强 IO、内存和调度压力的工作,其实都是 CPU… https://twitter.com/op7418/status/2056566924688146891/photo/1
波士顿动力机器人的新演示,现在可以搬动很重的东西 https://x.com/BostonDynamics/status/2056344756926460103/video/1
Telegram 上的机器人现在可以直接跟其他机器人对话了 也就是你的群聊可以直接拉多个不同的 Agent 机器人进行交流。 https://twitter.com/op7418/status/2056565482715795494/photo/1
今晚谷歌新视频模型的演示。 看起来肯定是可以进行视频编辑了,就是不知道是统一模型还是跟生成分开的 https://twitter.com/op7418/status/2056565195007504498/video/1
明天 20 (日)晚上凌晨 1 点就是今年的谷歌 IO 大会了,不知道有啥新活没有。 从泄露的几个看,如果模型没有大更新的话感觉能力上够呛啊。 https://twitter.com/op7418/status/2056385525007909272/photo/1
基于藏师傅 PPT Skill 的讲解视频生成 Skill,差不多搞定了! Codex 配合远程控制不在家也可以一键产出视频内容 可以用非常低的成本保证视频内容的可用性和表现力 这里的视频是我随便找了一个徒步文案一次生成的。 主要的内容用前端生成,只有配音和部分分镜使用音频和Seedance 2.0 模型 https://twitter.com/op7418/status/2056314568037761427/video/1
Anthropic 官方发布的 Skill 构建指南 我用 AI 翻译了一个双语版本,放下面了 https://twitter.com/op7418/status/2056048680290103504/photo/1
让 Codex 自己做了一条视频介绍了一下这个视频生成方案 藏师傅的 PPT Skill 负责美学、版式、动效 HyperFrames 负责时间线和渲染、字幕 Listenhub Skill 负责配音 即梦 CLI 负责 前端无法生成的演示和短 B-roll https://twitter.com/op7418/status/2056021133477163298/video/1
微信读书居然出 Skills 了,感觉挺有用的。它能够: 1. 查看你的笔记和划线 2. 推荐书籍 3. 查看你的数据统计和阅读统计 我让 CodePilot 整理了一下我的阅读数据,然后基于这些数据出了一个数据分析,试了一下。 https://twitter.com/op7418/status/2055992093882122727/photo/1
藏师傅的 PPT Skill+Codex+Heygen HyperFrames 这个组合太顶了! 可以直接基于问当生成带动效的解释视频 而且 Codex 居然可以在聊天里面直接预览视频,这个挺厉害的。 再加上即梦 CLI 补几个真实视频片段,用来做一些产品更新介绍之类的一点问题没有。 https://twitter.com/op7418/status/2055984747176939818/video/1
我终于知道昨天 OpenAI 官方的人回复我是啥意思了! Codex 除了用 ChatGPT 连接和远程控制以外,还可以在 Codex 再控制你的另一台电脑。 这样你就可以在 ChatGPT 上直接控制多台电脑,而不用在 ChatGPT 切换设备,只需要切换项目就好。 比如我这个 Mac Book 的 Codex… https://twitter.com/op7418/status/2055561525633642762/photo/1
再把 Hermes 爱马仕 也接进来,这次 Codepilot 重构就差不多了,就得收尾了 https://twitter.com/op7418/status/2055496585191280894/photo/1
尝试一下将 PPT Skills 作为产品去迭代和发布。 藏师傅 PPT Skills 截图美化逻辑更新 不需要消耗 GPT-Image 2.0 即可生成了! 现在内置了跟当前颜色和主题相吻合的截图美化背景图。 AI 会根据你的截图大小、长宽比以及 PPT 的模板类型,自动帮你把图片放到截图模板上,添加类似 CleanShot X… https://twitter.com/op7418/status/2055477163579891897/video/1
Claude 重置了五小时和这周的额度限制,周末可以爽了 https://twitter.com/op7418/status/2055452499323363335/photo/1
忘了发飞书 CLI 的地址了,没装的推荐试试: https://github.com/larksuite/cli
最近很多 Claude Code 的保姆级教程很火。 现在 Anthropic 官方出了一个 Claude Code 的保姆级教程,总共 9 节课,叫 Claude Code 101。 这玩意不比互联网上所有的 Claude Code 入门教程牛皮? 装个沉浸式翻译插件看一看,你就是 Claude Code 的专家了,冲 九节课的内容分别是: Claude Code… https://twitter.com/op7418/status/2055298462984597511/photo/1
刚才阿真提醒才发现, GPT 的 Codex 远程控制可以链接多个设备 只需要在你另一个设备的 Codex 上点击那个“设置 Codex 移动版就行” https://twitter.com/op7418/status/2055184073921044535/photo/1
飞书 CLI 牛皮啊,发布一个月多点就达到 10000 Star 了! 说明用户和市场相当认可这个动作 最近我们可以发现,越来越多的传统办公产品开始发布 CLI 和 Agent。 AI 时代的 SaaS 软件可能得换个做法了:UI 只是最基本的,接下来还要竞争对 Agent… https://twitter.com/op7418/status/2055173939522159052/photo/1
Codepilot 新版预览,即将支持 Codex 作为 Agent 引擎 https://twitter.com/op7418/status/2055154197956604386/photo/1
也可以直接在 ChatGPT 里边用控制 claude code 或其他的软件。 让 codex 调用 computer use 控制就行。 这样的话,如果你是 codex 和 cloud code 的协作开发,就可以让就可以都在 ChatGPT 里边进行控制。 你如果你开的是自动审查权限的话,就不太好控制,开那个完整权限才行。… https://twitter.com/op7418/status/2055135882290901063/photo/1
Lex Fridman 居然来中国了,就背个包。 也会跟国内的 AI 工程师录播客,不知道是哪几家,他的量还是很猛的
Codex CLI 设置 Chatgpt 远程控制
藏师傅的 PPT Skills,感觉 GitHub star 马上就要破万了呀! 没点 star 的朋友点点 star 吧,谢谢了。 顺便让 Codex 分析了一下安装的数据,还挺有意思的。 https://twitter.com/op7418/status/2055121582776021079/photo/1
GitHub 发布了 GitHub Copilot 桌面端的技术预览版。 看起来跟 Codex 长得有点像,在 GitHub 相关功能上露出的也比较多。 现在需要申请 waitlist https://twitter.com/op7418/status/2055111180369506481/photo/1
GitHub 发布了 GitHub Copilot 的技术预览版。 看起来跟 Codex 长得有点像,在 GitHub 相关功能上露出的也比较多。 现在需要申请 waitlist https://twitter.com/op7418/status/2055109493462351908/photo/1
Codex 终于支持手机上的 ChatGPT 远程控制了! 可以自动同步你绑定的 Codex 设备上的所有对话,而且可以直接发送指令、审批权限、监控进度。 我写一下设置的教程: 1. 点击桌面端 Codex 客户端左侧的“设置 Codex 移动版”,点击后系统会引导你开始设置。 2. 如果你的 ChatGPT… https://twitter.com/op7418/status/2055104256978681980/photo/1
嘉琛的 bridge 有些设计和能力真的很顶
Raycast 居然更新了一个 Beta 版本,也就是 V2 版本。 这一下让它从单纯的启动器,变成了一个“启动器 + AI Agent”的工具了 整体的 UI 和界面全部重做了,更符合现在的 Mac 系统设计。 基础架构重构 (a) 启动器底层全部重做 (b) 搜索、调度、扩展功能重新设计 (c) 设置界面被重构 搜索功能升级… https://twitter.com/op7418/status/2054903351222174138/photo/1
Claude Code 的每周限额将增加 50%,持续到 7 月 13 号。 但是他们这次终于把类似 OpenClaw 和 Codepilot 这种使用 Agent SDK 构建的应用额度砍了。 6月 15 号开始是双轨制: 只有在 Claude Code 本身及其内部,你的 Max 和 Pro 账户才能享受正常额度。 如果你是用于 Agent SDK… https://twitter.com/op7418/status/2054725474493067482/photo/1
用藏师傅的 PPT Skill 让 Codex 配图的技巧 涉及到一些非常生僻的事实你怕 Codex 画的图有问题的时候,可以让他搜索相关图片,然后基于搜索的图片生成新的图片 这样既可以保证真实性,又可以生成符合比例要求和高清的图片 比如云南这种甲马符 GPT 肯定是不知道长啥样的,但是垫图之后他能画的很好。 https://twitter.com/op7418/status/2054491392261632448/photo/1
Skills 已经更新了这个带地图的版式和地图组件 大家让自己的 AI 更新这个 Skills 就行。 地图支持放大缩小和拖动,以及 AI 可以在地图上做任意的标记。 https://twitter.com/op7418/status/2054433146532479266/photo/1
前几天去天津玩,去五大道的时候,无意间问了一下 AI 这里的历史,发现还是挺复杂的。 基本上近代好多名人和好多事件都与住在这儿的人有关系。 所以我就试了一下,用我的这个 PPT Skills 讲一下这些人的故事。 新增了一个排版: 1. 左侧是卡片 2. 右边是地图(这个地图是可以交互的,内嵌在了 PPT… https://twitter.com/op7418/status/2054418678918291482/photo/1
很多模型厂商开始发现开源 Agent 框架和客户端的价值。 大家都开始要么补贴客户端本身,要么补贴客户端用户。 但是我觉得还有一个非常重要的盲点。 就是像藏师傅、宝玉、乔木、一泽这种头部的 Skills 开发者。他们的 Skills 装机量其实非常大,遍布各种 Agent。…
谷歌昨天安卓 I/O 大会最大的跟 AI 相关的发布,是发布了 Gemini Intelligence 会先在三星 Galaxy 和 Pixel 手机上推出,后面会拓展到其他所有类型的安卓设备。 具体功能上,首先它可以帮你自动完成在多个 App 上操作的繁琐任务,而且可以跨多个软件去操作。… https://twitter.com/op7418/status/2054395133182042326/video/1
宇树发布 GD01 载人变形机甲,起售价 390 万人民币,这也太猛了。 刚才刷到评论说,大疆新的无人机能吊 600kg 物品,这个刚好 500kg,组合起来就是环太平洋那个经典镜头了 https://x.com/UnitreeRobotics/status/2054067819634159622/video/1
移动端的语音输入法必须带全键盘,但是桌面端的语音输入法最好跟输入法本身解耦。 Typeless 犯了前一个错误,豆包犯了后一个。
在拿了真格的 Token Grant 之后,跟他们聊了一下最近的一些思考,希望对大家有帮助。 https://mp.weixin.qq.com/s/KAv6l934Vkwiiu8Ufl_AiQ https://twitter.com/op7418/status/2054033406737142136/photo/1
谷歌看起来要发布 Veo 4 了,也有可能是其他的名字。 类似 Seedance 2.0 的全能参考,支持对视频进行:修改参考和内容替换 质量上看起来,在文字生成上要比 Seedance 2.0 稍微好点,但在其他方面看不出更好的质量,可能在清晰度和细节上也会稍微好点。 https://twitter.com/op7418/status/2054030953039921548/video/1
Claude Code 昨天更新了一个新的功能:Agent 视图。你可以在一个终端标签页里管理多个正在运行的 Agent。 你可以启动新的 Agent 并将其放在后台,Agent 视图会标注每个 Agent 的状态,包括:已完成、需要输入、正在进行。 你可以通过以下两种方式打开 Agent 视图: 1. 在任何会话点按左箭头 2.… https://twitter.com/op7418/status/2054024888567070925/photo/1
前 OpenAI CTO Mira 的公司 Thinking Machines 发了一个非常创新的模型,他们叫交互模型。 这个模型能够持续接收音频、视频、文本等原生的多模态内容,并且实时进行思考、响应和行动。 它不像之前那种 Agent 脚手架,把多个模型、多个模态的模型通过 Agent 串起来,而是所有模态都在一整个模型里。… https://twitter.com/op7418/status/2054023602874491326/video/1
来了!藏师傅的 PPT Skill 更新了第二套主题 新主题更加简洁美观,适合讲一些数据和事实性的内容 而且支持 4 种颜色、20 多个版式。 支持用 Codex 内置的 GPT-2.0 帮你生成配图和美化截图。 还能让它帮你生成各种平台的封面,以及公众号配图。 文章里详细讲了一下怎么用,还有一些小技巧。 https://twitter.com/op7418/status/2053743942097911952/video/1
https://x.com/i/article/2053655813877870592
歸藏的 PPT Skill 新主题更多内容的预览 https://twitter.com/op7418/status/2053381253328752903/video/1
厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告 https://twitter.com/op7418/status/2053143307371556944/photo/1
北京这几天的夕阳是真漂亮。 https://twitter.com/op7418/status/2053065172873560499/photo/1
RT @oran_ge: 欸,真的对不起大家。 我们也做了一个艰难的决定,决定增加我们的员工队伍。 Agent 工程师真的不嫌多,欢迎大家来聊聊。 [email protected]
RT @xiaohuan_tech: 我们也做了一个轻松的决定 欢迎大家加入全球最AI Native的公司 base 上海 [email protected]
Mac Studio 也没货了 https://twitter.com/op7418/status/2053020181853778289/photo/1
当前 AI 产品演进已经确立了一个清晰的行业共识: 采取数据与表现分离的架构,以 Markdown 负责底层逻辑与记忆的纯净存储,用 HTML 实现对外的高密度交互与展示。 这个思路的脉络是,前几天借着 Obsidian 作者提出 Markdown 是 AI 内容谢林点的观点,我发散讨论了当前 AI 原生格式主要分为 Markdown… https://twitter.com/op7418/status/2052943672556274040/photo/1
Linear 的人用这种道歉的语气招人,嘲讽那些以用 AI 为理由裁员的公司 https://twitter.com/op7418/status/2052925146290417977/photo/1
还记得年初推荐过的西元做的命理 App FateTell吗? 他们整个 App 的功能做得相当完善和全面,UI 设计和交互也非常顶,很有那种中式的命理感觉。 而且它不会刻意堆砌元素,在视觉和交互上的融合非常好,体验很棒。 这次他们除了以前那份以一生为长度、为维度的“命书”报告之外,新推出了“马年运书”。… https://twitter.com/op7418/status/2052788859164086589/photo/1
最近抖音上把你的户外照片做成“法天象地”效果的图片非常火。 他们大多是生成的图片,但我试了一下,直接生成视频的效果会更好。 优化了一下提示词,主要是 GPT-Image-2.0 加上 C-Down 3.0。图片的提示词我放在视频后面了。 https://twitter.com/op7418/status/2052764933696475279/video/1
Codex 越来越猛了,昨天更新增加了内置的谷歌浏览器插件,可以直接控制你的谷歌浏览器执行任务。 而且它可以在后台跨浏览器页面并行工作,不耽误你正常使用浏览器。所谓“并行工作”,指的是你可以启动多个子 SubAgent 帮你操作多个网页。 我试了一下,发现最厉害的一点是:它不仅可以控制… https://twitter.com/op7418/status/2052576841656099037/photo/1
GPT-image-2.0 + Seedance 2.0 https://twitter.com/op7418/status/2052427824120951212/video/1
过去一段时间,最值得的硬件投资可能就是我那个最低配的 Mac mini 了。 在年前买了以后,到现在几乎只关过一次机;在我出门旅游之类的时候,它一直运行得非常稳定,相当于一个自己的 Agent 服务器了。 随着里面跑的东西越来越多,现在有时候感到有点捉襟见肘了,所以就换了一个 Mac Studio。… https://twitter.com/op7418/status/2052237136401989805/photo/1
Obsidian 作者这两条推很有意思。 Markdown 文件已经事实上成为了当前 AI 文件交互的一个 Schelling point。 大家都默契地选择将自己的文本文件系统变为 Markdown 格式后再进行其他工作。 Markdown 赢得了 AI 时代文本格式的战争。基本上,现在 AI 时代的文本格式和内容展示被局限在了 HTML 和…
昨天 Claude 演讲的开场动画,只用点阵动画和 Claude 的像素形象,但是效果非常丰富而且节奏很好
5 千多 Star 了,上涨速度真快啊 https://twitter.com/op7418/status/2052226647475282230/photo/1
Anthropic 又从 SpaceX 买了一些算力,看起来最近估计算力问题能缓解一下,Opus 4.6 估计状态要正常了 https://twitter.com/op7418/status/2052061499615805550/photo/1
最近有两个非常出圈、非常牛逼的短剧: 一个是《Enemy》,一个是《吉时已到》,可以看看 热度爆表,制作效果也很好,成本不高 如果要做 AI 内容,或者说做 AI 短剧之类的内容的话可以把这两个剧当成暂时的质量标杆去对齐 https://twitter.com/op7418/status/2051866758332735838/photo/1
OpenAI 更新了 GPT-5.5 Instant 模型,现在变成了 ChatGPT 默认模型。 模型提升了实时准确性和日常任务的表现,主要改进: 性能优化:在法律、金融、医学等领域的幻觉率明显下降。同时,在图片理解和文档解析方面表现更好。… https://twitter.com/op7418/status/2051845335501455605/photo/1
这个 html-in-canvas和 Three.js 做的动画太炫了 html-in-canvas 允许开发者将真实的、可交互的 HTML 和 CSS 直接渲染到 <canvas>(包括 2D、WebGL 和 WebGPU)中。 https://x.com/kaolti/status/2050715622879760502/video/1
Codex 也上了宠物功能 /pet 开启 https://x.com/OpenAIDevs/status/2050275713824211041/video/1
吴恩达新课,26 年的 AI 提示已经和 23 年有很大的不同 所以他开了一门的新的提示工程课程
有些游戏圈的朋友总是觉得,AI没办法做数值,好游戏不是靠这个,还要有玩法。 那什么时候才能分享呢?AI 能做所有的事?一句话让 AI 做个 3A? 不然我就不能让 AI 做游戏,也不能分享我的体验? 当 AI 能做一个非常完整的好游戏的时候,要人干嘛呢? 我只是向大家展示一下这个可能性,做个 demo。…
这个 GPT-Image-2.0 标注图片的提示词最近在抖音也很火,晒照片的时候会用到。 提示词: 请观察照片中的元素、并为每个物件加上有意义的 手绘风注解。请填写照片中的物品。… https://twitter.com/op7418/status/2050079838179135746/photo/1
类似 Roblox 这样的社区型游戏和社交驱动的小游戏产品会很火。 以前构建这种游戏的类型非常少,而且成本也比较高。但现在其实每个人都能构建各种游戏。 像早期的 Dota 和 PUBG 的原始玩法,其实都是一些游戏的Mod演变出来的。 所以理论上,现在基于 AI…
这个网页效果太好了,动效非常舒适
最近 GPT-Image-2.0 很多提示词又火了,比如这个拉跨鼠标手绘图,原贴有提示 https://twitter.com/op7418/status/2050075020714815898/photo/1
最近 AI 参与的高品质游戏内容越来越多了。 又发现一个,这个看起来会上架 Steam,是一个国风的恐怖探案类游戏。
Codex 更新了,现在可以连接 Slack、邮箱以及你的谷歌云盘,从里面获取内容来执行任务,也可以把你的信息添加到谷歌日历。 https://twitter.com/op7418/status/2050041028510708086/photo/1
整个过程里边,Codex 最震惊我的就是这个: 给他找了一个有上千张图的游戏素材包,然后让他从里边找一些能用的素材。 我也没说怎么找,他自己给每个文件的图片都拼成了一张大图,上面是图片和文件名。… https://twitter.com/op7418/status/2050030364018819581/photo/1
本来是想随便玩一下的。 没想到 Codex 真的用一下午帮我开发了一个非常完整的类似《杀戮尖塔》的卡牌游戏。 代码和客户端都已经开源了,大家可以试试 https://twitter.com/op7418/status/2050024106578661458/video/1
https://x.com/i/article/2049902517254070272
小红书最尊重的博主,他妈的这帮逼又偷老子东西。 https://twitter.com/op7418/status/2049835040704803189/photo/1
DeepSeek 多模态大语言模型的论文《Thinking with Visual Primitives》已经公开 底座是 DeepSeek-V4-Flash,MoE架构,总参数量 284B,激活参数量 13B。 自研 DeepSeek‑ViT 视觉编码模型,14×14 patch,输出后 3×3 空间压缩,再接入 LLM。… https://twitter.com/op7418/status/2049823491017592924/photo/1
DeepSeek 多模态大语言模型的论文《Thinking with Visual Primitives》已经公开 底座是 DeepSeek-V4-Flash,MoE架构,总参数量 284B,激活参数量 13B。 自研 DeepSeek‑ViT 视觉编码模型,14×14 patch,输出后 3×3 空间压缩,再接入 LLM。… https://twitter.com/op7418/status/2049823431781384494/photo/1
基本上今天晚上或者明天就会有安装包,然后整个代码也会开源
太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。 https://twitter.com/op7418/status/2049776147618320816/video/1
我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。 我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的 这是能玩的! https://twitter.com/op7418/status/2049698879181144235/photo/1
Deepseek 的多模态模型全量了。 目前可以在网页版的识图模式尝试,看起来是一个单独的多模态模型 https://twitter.com/op7418/status/2049488861836013616/photo/1
Moxt 是近期所有新的 Agent 产品里,我觉得最好的之一 ! 终于找时间写了一篇介绍。 如果你还在找一个 AI Native 的组织协作工具的话,我觉得可以试试。 https://twitter.com/op7418/status/2049458103675191550/photo/1
https://x.com/i/article/2049456244537409536
Ghostty 的负责人今天说他会离开 GitHub。 这哥们在 GitHub 有 5 万多的粉丝,每天都有提交,是重度的 GitHub 使用者。 他的意思是,GitHub 现在频繁的故障和不稳定的服务已经严重影响了开发工作,导致他觉得这里不再适合进行严肃工作。… https://twitter.com/op7418/status/2049320408881709464/photo/1
近期第三条百万曝光内容了,这个 Skill 几天就干到了 3800 Star https://twitter.com/op7418/status/2049172814213558784/photo/1
优化了一下我的 PPT Skills 在 Codex 的效果 现在太牛逼了,图片也能一键搞定! 能够调用 Codex 里的 GPT-Image-2 去帮你生成图片。 而且我为此做了专门的设计,它会有独特的风格,并根据你的内容生成不同类型的图片,包括: - 营造氛围的人文纪实图片(类似胶片机拍摄的效果) -… https://twitter.com/op7418/status/2049094944405737512/photo/1
最近北京的天气真的好 https://twitter.com/op7418/status/2049081049930727612/photo/1
小米牛皮!早上申请的中午就到了 直接给了 329 的赠金,相当于一个月的 Codeplan Pro 会员 https://twitter.com/op7418/status/2049046284615790596/photo/1
Codex 又重置了速率限制,一到周末就重置。太猛了OpenAI https://twitter.com/op7418/status/2049012665876627564/photo/1
我先看看能不能给 Codepilot 用户争取到免费的 Token 补贴
小米 MiMo -V2.5 系列模型全部开源 采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。 同时他们还推出了Orbit 100T Token 计划。 这个太牛批了!如果你有自己 Vibe Coding 一些东西可以去领一下。 包含两部分: 分别是面向 AI builder 的『百万亿 Token… https://twitter.com/op7418/status/2048956024141598736/photo/1
最近正在重构 CodePilot,把 AI 能做的事情变得简单点,AI 不能做的东西变得详细点。 https://twitter.com/op7418/status/2048599545618243802/photo/1
看来真的很受欢迎,最近看到大家分享的线下 PPT 里面,很多都用了我这个模板。
藏师傅的 PPT Skill 现在有动效了! 给每个版式都搭配了对应的动效,都是为了配合展示,而不是只是图炫酷 本地动效文件让你在断网情况下也可以正常演示 https://twitter.com/op7418/status/2048245950813282481/video/1
GPT-5.5 真是太牛批了,除了超长程任务,其他能力上很多已经追平甚至超过 Opsu 4.7 了
这才是那个 Deepseek 啊,Deepseek 限时 2.5 折! V4-Pro 百万 Token 输出只需要 6 块钱朋友们,这还要啥自行车 https://twitter.com/op7418/status/2048033423659557289/photo/1
修复了一些问题,增加了 Skill .sh 的安装方式 https://twitter.com/op7418/status/2047866300459069475/photo/1
我去老马不过了? 怎么半个月給 1000 美元阿 https://twitter.com/op7418/status/2047837372767940678/photo/1
没想到能在北京见到每天刷到的其他海外 KOL,太神奇了
发点东西真难啊,小红书兄弟们依旧给面子,依旧据为己有 https://twitter.com/op7418/status/2047569778756526535/photo/1
如果提供足够的上下文和工具的话,Agent 能力真的很强。 这个 PPT skill 其实是在我的 Codepilot agent memory 上生长出来的。 我跟他大致说了一下我想要一个什么样的氛围,可能只有 3 行文字。 他给我的第 1 版。就是这样的,已经差不多了。…
测试了一下 DeepSeek V4,完全无法正常调用 Skill。 指令遵循和工具调用的效果很差,不知道是他们发布的原因还是什么问题。 用我那个 PPT Skills 测试,它都没有办法读模板,自己随便实现了一个网页。 https://twitter.com/op7418/status/2047535616859287605/photo/1
I built a Claude Skill that makes slides look like magazines, not PowerPoint. Ten years of design experience, compressed into one skill file. The world hasn't woken up to the fact that AI-generated slides don't have to look AI-generated. - Claude interviews you with 6… https://twitter.com/op7418/status/2047531739581763957/photo/1
中文: 我打造了一种克劳德技能,让幻灯片看起来像杂志,而不是 PowerPoint。 十年设计经验,被压缩成一个技能文件。 世界尚未意识到,由人工智能生成的幻灯片不必看起来像人工智能生成的。 - 克劳德采访了你6个。
Code Pilot 0.54 第一时间支持 DeepSeek V4 Pro 和 V4 Flash! 填写官方 API Key 就可以使用 同时也支持最新的 GPT 5.5 的反代和小米最新的 MiMo 2.5 Pro 模型 https://twitter.com/op7418/status/2047523836904853828/photo/1
DeepSeek V4详细的官方公告也发了: 模型参数 (a) Pro 版本:总参数 1.6T,激活参数 49B (b) Flash 版本:总参数 284B,激活参数 13B (c) 预训练数据量:均为 32T 模式区分(网页端与 APP) (a) 专家模式:代表 Pro 版本 (b) 快速模式:代表 Flash 版本 测评表现 在多项测评成绩上,该模型与 Opus… https://twitter.com/op7418/status/2047512236848247112/photo/1
我去,DeepSeek V4 终于来了! 有两个型号,一个 Flash,一个 Pro。 新版本的功能支持非常全面: 支持 JSON 输出 支持工具调用 支持对话前缀续写 支持 FIM 补全 价格方面: Flash 型号:每百万输入/输出的价格分别是 ¥0.2 和 ¥1 Pro 型号:每百万输入/输出的价格分别是 ¥1 和 ¥12 另外,100… https://twitter.com/op7418/status/2047509948800856335/photo/1
我去,新的 Codex 太适合我这个 PPT Skills 了! GPT 5.5 的前端能力大幅提升,所以排版不是问题。 然后它内置了浏览器,你可以直接在里面预览生成的 PPT。 还有就是它能够调用 GPT-Image 2 为你的 PPT 生成配图。 我去,还有你能够直接点击评论对应的区域让它改! https://twitter.com/op7418/status/2047492666729132205/photo/1
卧槽!试了一下用 GPT 5.5 驱动这个 PPT Skill。 CodeX 简直非常适合拿这个 Skill 做 PPT,因为它会自动往 PPT 里用 GPT-Image-2 生成配图! 而且它的内置浏览器还能直接在对应元素上评论,让它修改。这不比 PPT 软件好用啊! https://twitter.com/op7418/status/2047490936561954969/photo/1
昨天答应的 PPTSkill 来了! - 包含 10 个板式、5 套主题,覆盖各种场景 - WebGL 流体动画背景,非常炫酷 - AI 会帮你规划大纲、选主题、支持图片匹配和添加 文章里还有一些 Skill 制作的方法和详细的使用教程,可以看看。 https://twitter.com/op7418/status/2047486744875139295/photo/1
https://x.com/i/article/2047484171258634240
做了个非常牛逼的网页 PPT Skills,明天发 彻底解决你的 PPT 生成难题 昨天分享的内容不知道怎么样,反正很多朋友看上了我的 PPT,索性做个 Skills,明天开源一下 https://twitter.com/op7418/status/2047317436157026628/photo/1
居然可以在 Claude 桌面端用三方模型了! 只需要启用开发者模式填写 API 和 Key 就行,不管是各种 Code plan 还是三方的 Claude API 都可以 开启步骤: - 安装 Claude 桌面端不登录 - 左上角找到 Help → Troubleshooting → Enable developer mode → 重启 - 重启后右上角就有 Developer… https://twitter.com/op7418/status/2047297968743874586/photo/1
火回国内了🐶 https://twitter.com/op7418/status/2047158876039192997/photo/1
Agent 可以被分享以后,协作自然而然发生 发现一个非常有意思的产品! Bloome 可以把你本地的 Agent 和线上 Agent 拉群。 比如说龙虾、Claude Code 和 CodeX 都能在一个群里协作。 这样的话,你完全可以让你多个 Agent 的上下文和能力都在一个群里协作完成。 系统会自带一个云端的… https://twitter.com/op7418/status/2047135982370312509/photo/1
百万曝光了 没想近期到第一条出圈的是这个,小红书和抖音跑的也不错
Codepilot 0.53.0 已经支持 GPT Image 2.0 图像模型 官方和三方都可以,Nano Banana 2 也可以用三方的了 详情:https://github.com/op7418/CodePilot/releases/tag/v0.53.0 https://twitter.com/op7418/status/2047134047454077177/photo/1
又跑了一条《黑神话:林冲》的游戏演示,这个效果超级好! GPT-Image-2.0 + Seedance 2.0 所有的交互 UI 全都是动的,而且还有台词。 要不是画面这个涂抹感,我真看不出来! https://twitter.com/op7418/status/2046873133832077445/video/1
坏了!这下真能玩了 用 Seedance 2.0 直接把GPT Image 2 生成的 ARPG 《金瓶梅》游戏做成动态的了 UI 交互和两个画面之间的衔接都做了 https://twitter.com/op7418/status/2046854932620525750/video/1
随手拍了一张蓝莓,让 GPT-Image-2 生成符合这个产品风格的宣传图 一致性还原也太好了,每个设计元素都是对的。 这个对电商来说帮助非常大,它甚至连蓝莓的位置都没给你变,但是蓝莓变得更大更饱满了。 非常聪明,知道啥东西能变,啥东西不能变。 https://twitter.com/op7418/status/2046626506722746736/photo/1
还记得前几天比较火的 SBTI 吗? 尝试着用 GPT 的新图像模型做了一个这种测试。 直接让它基于“战锤 40K”的背景问了几个问题,然后给生成了一个测试报告。 https://twitter.com/op7418/status/2046592331911147824/photo/1
来了!今晚的 GPT-Image-2 发布预告
GPT-Image-2 太猛了呀! 我随便拍了一张图片,让他给我生成宣传图,什么都没说。 他给我搞的这个氛围非常上档次 https://twitter.com/op7418/status/2046581756523123192/photo/1
只需要一句话,就能让 GPT 生成整篇小说的剧情和世界观介绍长图 我这里生成的是《神秘复苏》的 提示词:帮我用一张长图详细地介绍《神秘复苏》这个小说的剧情、故事线和世界观。 https://twitter.com/op7418/status/2046578883475243176/photo/1
找了张车的图片让他生成汽车官网设计稿,我没说这是啥车 https://twitter.com/op7418/status/2046576147530731755/photo/1
黄老板这个玩法好啊,可以在 GPT 里面玩 ARPG 游戏了。 具体流程如下: 1. 它会给你生成剧情画面和对应的选项; 2. 你选完以后,让它生成选择后果所对应的下一幕图片; 3. 接着会出现其他的选项,就可以这样一直玩下去。 https://twitter.com/op7418/status/2046571494969655576/photo/1
黑神话:潘金莲? https://twitter.com/op7418/status/2046526139687215159/photo/1
把 Seedance 2.0 模型的论文给到 GPT-Image-2 模型,它生成的论文解释长图 https://twitter.com/op7418/status/2046523217662316692/photo/1
我去!OpenAI 新模型这尺度有点大呀! 提示词:帮我生成一个以《金瓶梅》为主题的古代 ARPG MMO 开放世界游戏的截图 https://twitter.com/op7418/status/2046520509651886451/photo/1
看起来 Open AI 的 gpt-image-2 模型全量上线了! 现在就可以用,效果非常顶! 第一张图我就让它可爱地解释一下大语言模型训练过程,这质量也太好了! 第二张图我就给了他一个 OpenAI 的更新文档,然后让他介绍一下这个更新,他就给了我这样的东西。 太牛批了! https://twitter.com/op7418/status/2046502136973001143/photo/1
这个更新以后,我终于可以脱离 Obsidian 使用了
CodePilot v0.52.0 更新 AI 生成的东西(文档、网页),现在能在侧栏直接看、直接改、直接导出。 - React 组件(.jsx / .tsx)→ 聊天里点一下看实时渲染 - 表格(.csv / .tsv)→ 表格视图 + 列排序 + 一键导出 - Markdown → 预览里直接编辑,停笔 1 秒自动保存 - HTML →… https://twitter.com/op7418/status/2046441960471396652/photo/1
Codex 越来越好了,上了一个新的 Memory 功能 Chronicle。 它可以自动持续截屏来获取记忆,这样你不用跟 Codex 交代,它就能了解你指的是哪个文档和哪个 Bug。 这些截图都存在本地,目前需要 Pro 用户才能使用。 https://x.com/OpenAIDevs/status/2046288243768082699/video/1
库克卸任了,真干脆啊,估计秋季发布会就是新 CEO 讲了 https://twitter.com/op7418/status/2046418273479340455/photo/1
Miclaw 现在支持多终端了。 在 PC 和 Mac 上能够跟手机跨端连通,共享记忆。 然后在小爱音箱上,可以通过小爱音箱控制手机和电脑,支持连续多轮对话。 比如你可以在手机上要求它把电脑上指定的文件发到你手机。 https://twitter.com/op7418/status/2046415964456239304/photo/1
这么长时间了,终于给自己整了一套 PPT 模板 https://twitter.com/op7418/status/2046275153852866799/photo/1
Open AI 这周要起飞了呀! 昨天有人说 GPT Pro 新模型正在灰度,前端能力突飞猛进。 我试了一下,只把 CodePilot 的 GitHub 页面发给它,再传了几张现在的截图,说了两三行提示词,它就给了一个完整的桌面端产品设计。 我觉得这比 Claude Design 牛逼多了: 1.… https://twitter.com/op7418/status/2046172697118601349/video/1
后面还会支持 M5Stack Cardputer 这个设备可玩性会强非常多,自带麦克风、3.5 毫米耳机孔、陀螺仪 最屌的是有全键盘,到时候语音打字都行 https://twitter.com/op7418/status/2046055639349383269/photo/1
开源了! 拿墨水屏蓝牙控制你的 Claude code,监控多个对话状态,并且快速审批权限。 ​ ​现在做硬件的门槛是真低啊,USB一插让Claudecode跑就行 https://twitter.com/op7418/status/2046046165951816172/photo/1
https://x.com/i/article/2046044777817448448
今天的夕阳漂亮 https://twitter.com/op7418/status/2045822360310452464/photo/1
搞的差不多了 https://twitter.com/op7418/status/2045461673717404088/photo/1
牛逼,现在人手一个智能硬件! 我现在能用这个墨水屏监控我的 Claude Code 和 Codex 的状态,同时进行审批。 在在家里的任何一个地方都可以。 项目基于 Claude 那个实体 buddy 项目。 但是它只能在 M5StickCPlus 上运行,而且必须安装 Claude 桌面端。 我把它改成了可以在 M5 Paper… https://twitter.com/op7418/status/2045389498301689964/video/1
之前爆料的 Claude 设计工具上线了 类似 lovable 那种,可以帮你生成网页和APP原型以及PPT等内容 支持导出PPT格式和导出到Canvas https://twitter.com/claudeai/status/2045156267690213649/video/1
我靠,HeyGen 发布这个 hyperframes CLI 很强啊 跟我之前的一个想法类似,就是它把用纯 HTML 写的那个动效变成视频。 然后再接一个(比如 Seedance 2.0 这样的)模型。 这样你就可以纯零人工介入,实现人脸出镜的那种科普视频了。… https://twitter.com/op7418/status/2044987637501665673/video/1
Seedance 2.0 的 API 终于全量开放了!我等这个很久了 国内用户通过火山引擎现在就可以调用Seedance2.0API,海外用户可以通过BytePlus接入 Seedance 2.0 这种非常智能的视频模型,很适合用来做各种视频 Agent。… https://twitter.com/op7418/status/2044970249548890409/photo/1
没等来 Image 模型,等来了 Codex 大升级。 现在这玩意儿简直是 All-in-One 的应用,不只能用来开发,他们把那个 ChatGPT 的功能也都塞进去了。 主要是这个 Computer Use 功能对于开发来说太好用了。 你可以直接让它对你的产品进行 UI 测试,这是目前 Web Coding… https://twitter.com/op7418/status/2044965773408641334/photo/1
没等来 Image Viewer 模型,等来了 Codex 大升级。 现在这玩意儿简直是 All-in-One 的应用,不只能用来开发,他们把那个 ChatGPT 的功能也都塞进去了。 主要是这个 Computer Use 功能对于开发来说太好用了。 你可以直接让它对你的产品进行 UI 测试,这是目前 Web Coding… https://twitter.com/op7418/status/2044965735152373941/photo/1
即梦现在可以用Seedance 2.0 生成 1080P 的视频了 试了一下,太屌了!感觉这个才是满血的 Seedance 2.0 这个细节就不说了。我感觉这个模型它的智能程度和提示词理解能力也上升了。 在“全能参考”上,对于素材的使用非常灵活,而且跟整个视频融合得更好。 https://twitter.com/op7418/status/2044808829620380119/video/1
Claude Code 上可以用 Claude Opus 4.7 了。 默认是 X-HIGH 的推理强度,如果你觉得不够的话,可能得自己手动换到 Max。 https://twitter.com/op7418/status/2044805298792407377/photo/1
哥们的头像画的是真好,这个风格。 然后拿他这张图,让 Nana Banana 画了一些《红楼梦》和《金瓶梅》里的角色头像。 https://twitter.com/op7418/status/2044800056973570417/photo/1
来了!Anthropic 发布了 Claude Opus 4.7 模型,主要更新如下: 1. 核心能力提升 2. (a) 可以处理更长时间的任务 (b) 指令执行更精确 (c) 在汇报前会自我验证输出,从而在更少监督下完成长时间的工作 2. 视觉与思考增强 (a) 视觉能力大幅提升,可以非常精细地查看图像,可以接受长边最长 2,576… https://twitter.com/op7418/status/2044787172725903461/photo/1
看来今晚是 GPT-Image-V2 大战 Claude OPUS 4.7 啊 https://twitter.com/op7418/status/2044753128080453809/photo/1
我操,OpenAI 新的图像模型 gpt-image-2 太牛逼了! 我就给了它我项目的 GitHub 链接,然后让它生成卡片式的互联网宣传图,所有的信息都是对的。 中文生成也非常的准确,没有一个错字。 对比一下最近谷歌对 Gemini Nano 2 的降智,高下立判。 我这 Pro 会员买对了呀! https://twitter.com/op7418/status/2044721146873225398/photo/1
lenny 忘了退了,妈的 刷屏了,记得退啊朋友们 https://twitter.com/op7418/status/2044677220011307413/photo/1
Logo 生成和展示 Skill,昨天搞了一天,终于搞定了! 最后的效果比我展示的还要强! 发给 AI 你的产品介绍就能生成,通过网页展示设计思路和结果。 还可以用 Nano Banana 生成很高级的 Logo 展示图。 支持用代码生成动态 Logo 展示网页,非常适合做 PPT 封面或者官网元素 https://twitter.com/op7418/status/2044636421550751908/video/1
https://x.com/i/article/2044633435613130752
当你觉得自己 vibe coding 的东西是坨屎的时候,你不妨看看谷歌。 这可能是他们一个团队干了一年的成果。
谷歌在产品上真是太慢了,终于推出了 Gemini 的 Mac 客户端。 全部用 Swift 编写的原生应用. 看了一下,功能相当简陋,很多能力都没有。 比如 Artifact 复杂点,网页都没办法渲染。整个 UI 非常糙,谷歌正常发挥水平。 https://twitter.com/op7418/status/2044606346117747121/photo/1
Skills 快搞定了。 看起来用网页写,加上 WebGL 和 Framer Motion,也能搞出非常漂亮的背景。 不用 NanaBana 图片生成也行,到时候可以自由选择。 https://twitter.com/op7418/status/2044360853626262006/photo/1
Anthropic 重构了 Claude 桌面端,现在侧边栏的所有内容都统一到一个地方,并且支持分屏了。 其实很多人不知道 CodePilot 也是支持分屏的,而且非常早就支持了。 https://twitter.com/op7418/status/2044290912151580811/photo/1
现在各家的 Code plan 采用 Anthropic 兼容模式的时候太难搞了,尤其是对我们这些非 Claude Code 又兼容这套逻辑的开发者。 你根本不知道最后用的模型是哪个,因为最后都会被传成 Claude Code 那三个模型。 而且模型发布也没有 API,或者说 API 不会返回模型真正的名称,每次上新模型都得更新代码。…
我觉得今年这句话更重要了。 只是解构会慢慢地、慢慢地把自己也解构掉,还是要做点东西
Codepilot 0.50.1 版本更新 现在飞书连接支持一键搞定了,直接打开网页创建应用并拿到全部权限。 添加了子 Agent 展示 UI,你可以看到进度 添加了消息队列能力,AI 正在回复也可以继续发消息 增加草稿保存,输入框的内容切换聊天也不会消失 还修复了一堆桥接已经存在的问题 https://twitter.com/op7418/status/2044246216989651385/photo/1
Claude Code 新发布的 routines 功能很强啊! 把云端和本地环境连起来了,可以在云端跑定时任务不需要开机。 跑完的任务本地还能接上,等你工作的时候继续处理。 你可以把「提示词 + 仓库 + 环境 + 连接器」打包成一个云端自动任务,让 Claude 在你电脑关着时也能按计划或事件自动跑。… https://twitter.com/op7418/status/2044107108283727997/photo/1
小红书的一些朋友太爱我了,我去。 ​ ​一个字不差抄我的推特,主要是人家还有量。 https://twitter.com/op7418/status/2044059677533843944/photo/1
当然,你能从这些图案里找到很多相似 logo 的痕迹,所以也有人说这些不配叫 logo。 我觉得。严格来说,如果要注册商标,很多东西都不能叫 logo,比如说原贴下面有人贴的一个很像第一张图的圆点 logo,我能找到无数种。…
看起来代码也可以做到,甚至做成动态的 哈哈 感觉这个做网页背景或者 PPT 背景也不错 https://twitter.com/op7418/status/2043977612587081943/video/1
我去,这效果确实牛逼,非常的上流! 探索出了一条用 Gemini 和 NanaBana2 配合来生成 logo 以及 logo 展示图的工作流。 https://twitter.com/op7418/status/2043913881526120528/photo/1
更多迭代版本 https://twitter.com/op7418/status/2043896958704812474/photo/1
Gemini 真是做设计的一把好手,尤其是用 SVG 画 logo 只要给一些适当的引导就可以画的很好 给 Codepilot 的新 logo SVG 的部分也是他完成的,我自己在基础上精修 https://twitter.com/op7418/status/2043722921856860201/photo/1
又炸了 https://twitter.com/op7418/status/2043721492807241746/photo/1
为任何产品生成高级感宣传动画提示词 Skill! 他会询问你的产品信息和让你提供截图帮你生成Seedance 2.0 产品宣传动画提示词。 如果你装了即梦 CLI 还会自动帮你生成视频 https://twitter.com/op7418/status/2043716532463927427/video/1
Seedance 2.0 在海外上线以后,很多用户也拿它来做产品宣传动画。 这哥们的提示词写法非常牛皮! 刚好我最近给 CodePilot 做了一个新的 logo,然后就参考了一下,做了新的产品宣传动画。 顺便我总结成了一个提示词,你可以为你的产品也定制类似的 Seedance 2.0 提示词。 https://twitter.com/op7418/status/2043681071565517238/video/1
又一个新的 Agent 聚合软件 Superconductor 支持在一个软件里面启动比如 Claude Code、Codex、Gemini CLI 等其他编码 Agent Cali 工具 完全用 Rust 写的,目前只有 MacOS 版本 https://twitter.com/op7418/status/2043585003502948515/photo/1
即梦近期发布了他们的视频生成 Agent 产品 Octo! 用了一段时间发现他们在如何跟 AI 协作制作视频上思考得非常多。 无论是对于不太懂视频制作的普通人或者专业的视频内容创作者都非常好用,专门做了针对性的设计。 非常有创意的是随时可以按斜杠呼出的 Agent… https://twitter.com/op7418/status/2043267086546571705/photo/1
给 Codepilot 增加了类似 Hermes Agent 的 Skills 自动创建功能 如果你的整个操作链路非常复杂,AI 就会建议是否为这个流程生成 Skills https://twitter.com/op7418/status/2043181165012828373/photo/1
Hermes Agent 也原生支持连接微信了,不过不是微信官方的插件,也是逆向的。
Hermes Agent 也原生支持连接微信了,不过不是微信官方的插件也是逆向的。
Claude Code 生成的代码质量突然变好了不少,而且不会有之前那种偷懒行为了 不知道 Anthropic 做了什么改动,可能是卡到位了?
龙虾作者 Peter 的 Claude 账号早上被封了,发出来之后 Anthropic 给他解了,这一天天的 https://twitter.com/op7418/status/2042801282407371027/photo/1
一个新的实时可交互世界模型 Waypoint-1.5 主角动作流畅还能跟武器交互,运行也非常流畅 https://x.com/overworld_ai/status/2042287199513952563/video/1
Anthropic 最近算力成本真是顶不住了,疯狂降成本 昨晚又推出了advisor tool,Sonnet 和 Haiku 这种小模型执行任务的时候,可以调用 Opus 这种大模型介入指导。 有人说估计 Anthropic 也会用这种方式让我们访问 Mythos 模型。 因为这样用户无法直接访问模型,又能提高现有模型的能力水平。… https://twitter.com/op7418/status/2042612179040677954/photo/1
这几天这个 SBTI 可太火了。 跑去 B 站找原版测试了一下,他妈的,它骂我。 感觉这几天这种类型的测试会越来越多,肯定会有人整Skill的 https://twitter.com/op7418/status/2042442402867397023/photo/1
这几天这个 SBTI 可太火了。 跑去 B 站找原版测试了一下,他妈的,它骂我。 感觉这几天这种类型的测试会越来越多,整个 skill 吧,不行。 我就不整了 https://twitter.com/op7418/status/2042441840268624214/photo/1
牛逼,OpenAI 终于推出 100 美元的 Pro 会员了! 有 5 倍的 Codex 用量,而且 100 美元的 Pro 会员也能用所有的 Pro 功能。 同时你现在买 100 美元的 Codex,到 5 月 31 号会有比 Plus 多 10 倍的 Codex 用量。 已经买了 $200 的 Pro 会员,也会有双倍的用量,持续到 5 月 31 号。… https://twitter.com/op7418/status/2042427550371364924/photo/1
天天给别人的产品写教程,今天终于轮到自己的产品了。 我觉得 Code Pilot 已经相当可用了,给它写了一个保姆级教程。 另外 Codepilot 现在可以脱离 Claude Code 运行,也支持了 GPT 账号的授权登录,使用你的额度。 https://twitter.com/op7418/status/2042229587082695054/photo/1
https://x.com/i/article/2042220307126292480
谷歌的迭代真的很慢,终于在 Gemini 应用里面支持按项目整理聊天和文件 类似 Claude 的 Project 功能,他们叫笔记本 你可以把自己跟Gemini 的聊天和文件都放到对应的笔记本里 也可以直接在 NotebookLM 中打开这个笔记本进行交流。 https://twitter.com/op7418/status/2042063643198812381/photo/1
小扎挖的团队终于交了第一份答卷,发布 Muse Spark 模型 支持原生多模态推理模型,支持工具使用、视觉思维链和多智能体编排。 还有“沉思(Contemplating)”模式,可以协调多个并行Agent 进行推理。 在 Artificial Analysis 上得分比 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6 低一些。 只能在… https://twitter.com/op7418/status/2042061816168378868/photo/1
Anthropic 发布云端托管 Agent 基础设施 Claude Managed Agents 帮你把安全沙箱、会话状态、权限管理、凭证和追踪等底层工程都打包好 只需要定义任务、工具和规则,就能让 Agent 长时间自主运行、调用工具、恢复错误,还有多 Agent 协同和自我评估迭代 把从原型到生产的周期从几个月压缩到几天… https://twitter.com/op7418/status/2042060231904260588/photo/1
发现了一个牛逼的新产品 Moxt 交互和产品的设计将新的 Agent 体系融合得非常好,门槛很低。 可以非常好的帮你将你的和团队的上下文变成工作的助力
今天在抖音看到一个好玩的,就是一个三个键的小键盘。 然后他把那个大疆的 Mac mini 不是后边有磁铁吗?粘在了小键盘的侧边。 这样的话就可以当成一个竖着的麦克风,还有三个按键。 然后你的大疆的那个接收器插在电脑上,你就可以躺在你家的任何一个地方,跟你的电脑交流和说话 https://twitter.com/op7418/status/2041733863316320771/photo/1
又重置使用限制,真有你的 Open AI Sam 还说每周用户每增加一百万就重置一次,直到达到一千万用户 https://twitter.com/op7418/status/2041692338192535761/photo/1
又重置使用限制,真有你的 Open AI Sam 还说每周用户每增加一百万就重置一次,直到达到一千用户 https://twitter.com/op7418/status/2041692296320839903/photo/1
前几天爆料的 Anthropic 超级模型 Mythos 居然真的存在。 Anthropic 说,这是他们至今为止最强的模型。 测评结果远高于 Opus 4.6,在代码理解、漏洞挖掘和利用上表现出了明显的跃迁能力,强大到他们不敢公布。 然后只用这个 Project… https://twitter.com/op7418/status/2041690827941142842/photo/1
Codepilot 帮我整理完后我的 Obsidian 笔记图谱 https://twitter.com/op7418/status/2041541675609428314/photo/1
终于彻底解耦了! 下个版本 CodePilot 可以支持脱离 Claude Code 运行,如果你要启用 Claude Code 连接的话也可以。 也还会支持 Codex 授权登录 https://twitter.com/op7418/status/2041384540690952563/photo/1
在开了 Fast 模式疯狂使用后 第一次用完 20 美元会员 Codex 的 5 小时限额 真 tm 耐用啊 https://twitter.com/op7418/status/2041358333597421595/photo/1
整理一下藏师傅开源的所有 Skill Claude-to-IM-skill: 1800🌟 安装后可以将你的 Claude Code 和 Codex 连接到任何聊天软件,实现远程控制 https://github.com/op7418/Claude-to-IM-skill Video-Wrapper-Skills: 200🌟…
Telegram 这个更新牛蛙 你的机器人可以自主创建和管理其他机器人了,不需要你的审批和操作。 这样你的龙虾或者 Claude Code 就可以帮你创建带有复杂功能的机器人 https://twitter.com/op7418/status/2041332295710462453/photo/1
现在做内容真的方便。 以前更新网页还得有个什么后台之类的东西。 现在我直接把这个网页数据更新做成了一个 skill 。 我在外面通过飞书连接我的 CodePilot。直接就能更新网站的数据和新闻。 https://twitter.com/op7418/status/2040981766991949870/photo/1
接下来 Codepilot 也要准备脱离 Claude Code 了 同时上个版本给所有的服务商都加上了 Codeplan 的获取链接 你现在可以直接在 Codepilot 跳转购买各家 Codeplan 了 https://twitter.com/op7418/status/2040977451254493399/photo/1
Anthropic 又有新的损招了。 龙虾的作者 Peter 发现了一件事,就是你如果用的是 Claude Code 或者是其他官方的 Anthropic 工具。 但是你一旦更改了系统提示词,比如出现了 Openclaw,那么就会拒绝你的请求,返回400这个报错。 感觉这是Claude Code泄露之后的一个补丁。 你现在拿泄露的Claude… https://twitter.com/op7418/status/2040976831038525872/photo/1
重新搞了一下网站,不然每年这个 .ai 域名太贵了,不用的话有点浪费 https://twitter.com/op7418/status/2040813070516359503/photo/1
karpathy 针对他这个 AI 知识库方案给了个更详细的版本 https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f https://twitter.com/op7418/status/2040471456820408449/photo/1
早上起来时间线上都在骂。 Anthropic 宣布说,不能用 Claude 账户中的额度使用 OpenClaw 这种三方的产品了。 他们会送你一个月的额度进行过渡,之后就得购买单独额度。 关于 Claude Code 的额度消耗异常问题,昨天也回复了,意思是不存在问题。 真太傻逼了,当大家傻子。 与此同时,Codex… https://twitter.com/op7418/status/2040245390814085270/photo/1
可以在 Codepilot 爽用谷歌新的本地模型 Gamma 4 了! Codepilot 0.46.0 更新了 Ollama 本地模型的接入 启动 Ollama 安装 Gemma 4 就可以在 Codepilot 里面爽用了 但是在终端里很快,然后传输到 Claude Code 就很慢,不知道 Ollama 这个里边是不是有一些问题。 https://twitter.com/op7418/status/2040105334833062293/photo/1
阿里昨天发布了 Qwen 3.6 Plus 模型 重点是 Agent 和编码能力有非常大的提升! 最近也是很高产:先是 3.5 Omni、万相2.7、然后就是Qwen 3.6 Plus,而且好像马上 Max 也要发布。 在关于开发和 Agent 的一些测评上,现在 3.6 Plus 的模型相较于 3.5 有显著的提升。 Qwen 3.6 Plus… https://twitter.com/op7418/status/2039991323252723945/photo/1
Arena 这个图能特别好地体现出谷歌 Gemma 4 模型的进步。 可以看到 Gemma 4 和 3、2 的一个区别: 以前它的得分是有非常明显的长板和短板的,而 Gemma 4 几乎全能 而且在参数没有大提升的情况下,得分高了非常非常多。 这两个性能提升的时间点分别是 9 个月和 13 个月。 DeepMind… https://twitter.com/op7418/status/2039990875972153713/photo/1
下个版本顺便支持一下 Ollama 吧 让大家在 Codepilot 里面本地用 Gamma 4
小米也推出了 MIMO 的 Code Plan 最便宜的 39 每月,最贵套餐 659 每月 统一 Credit 点数体系,没有 5 小时限额这种设置 CodePilot 0.45.1 版本将会支持 https://twitter.com/op7418/status/2039951231758876756/photo/1
今天下午 2:00 到 4:00,在腾讯研究院这边直播 https://twitter.com/op7418/status/2039911365373280649/photo/1
用香蕉做一张图片,来解释 Karpathy 的方法和我的方法之间的一些区别和共性 https://twitter.com/op7418/status/2039899094693593392/photo/1
Karpathy 分享了他如何构建本地的 AI 知识库 跟我用的方法也很相似,但还是有很多可以借鉴的地方,推荐看看。 都是用的 Obsidian,纯本地 MD,然后用一些反向链接、索引的方式把它们连起来。 他构建了一个用大语言模型驱动的个人 Wiki 知识库,然后把原始资料都丢进一个叫 RAW 的目录。… https://twitter.com/op7418/status/2039898050697839041/photo/1
谷歌还发布了一个安卓应用,来体验他们这次新发布的 Gemma 4 模型。 我用我现在的小米 17 Ultra 试了一下,在用这个 E4B 模型的时候,推理速度非常快。 而且这个 App 现在还内置了一个 Skills 的体验区域,你可以自己去让它调用工具编写和试用 Skills。 可以在 Google Play 搜索 Google AI Edge… https://twitter.com/op7418/status/2039890996293669248/photo/1
谷歌昨天发布了 Gemma 4,这次非常牛逼! 专门用来在本地设备(比如手机、电脑)上跑,而且支持了 agent 和工具使用。 四个参数大小: E2B:主打手机 / IoT / 边缘设备。 E4B:为移动端 + Jetson / 树莓派设计。 26B MoE:单次激活 3.8B,有效参数很小,主打高 TPS、低延迟。 31B Dense:全密集… https://twitter.com/op7418/status/2039890169512472793/photo/1
虽然出去玩了 10 天,但是效率还变高了,每天1.3 个版本
3 月 Codepilot 数据,下载量猛增 https://twitter.com/op7418/status/2039736411696542165/photo/1
刚发现 TRAE 发布了独立的 SOLO 客户端。 而且现在有网页端和 PC 端两个了,你可以根据自己的需求选择。 内置的 Skills 市场可以选择适合自己的 Skills,每个 Skills 都有对应的介绍还有案例。当然你也可以创建自己的 Skills。 Solo 客户端里面有两个模式,点击左上角切换,名字很清楚: Code 模式… https://twitter.com/op7418/status/2039682233737605381/photo/1
橘子 @oran_ge 新产品 ColaOS 发布了,最近用了一段时间确实牛逼。 门槛非常低,同时这个 AI 的语音以及它的人格调教得非常真实,让你不自觉地就想聊天下、对话下去。 而且能力也很强,该调用的那些工具都能调用。
智谱发布 GLM-5V-Turbo 模型 我最近用 GLM-5 Turbo 非常频繁又快又好,就是有时候没办法发图 现在终于可以搞定了
CodePilot 宠物助力上线! 完成度比 Claude Code 高多了! 藏师傅想用这个东西引导你去构建自己的 Agent 工作流程,所以它是可成长的 写了篇文章,解释了一下为什么这么做 https://twitter.com/op7418/status/2039291138771931454/photo/1
https://x.com/i/article/2039289963955802112
朋友们今晚在飞书直播间聊聊飞书 CLI https://twitter.com/op7418/status/2039238284359176661/photo/1
迫于泄露 Claude Code 的宠物模式已经提前上线 输入 /Buddy 就可以开启,会有简单的介绍和不同的属性 而且你在工作的时候他会在输入框旁边陪伴你 感觉比较轻量,支持的命令也比较少,可以叫他名字来获取见解 https://twitter.com/op7418/status/2039181223269142828/photo/1
谷歌发布了 V1.3.1 Lite 模型,价格大幅降低! 相较于 V1.3.1 模型,价格降了 8 倍,同时他们的 V1.3.1 Fast 模型价格也降了。 https://twitter.com/op7418/status/2039167939635708176/photo/1
Sam 太猛了啊 OpenAI 新一轮融资额度高达 1250 亿美元 卧槽,咋能凑这么多钱啊,不是估值是融资额 给投资人下药了啊
明天就可以在 CodePilot 里面提前体验 Claude Code 还没有上线的重磅宠物功能了! https://twitter.com/op7418/status/2039015035562004582/photo/1
CodePilot 用户有可能优先尝试所有Claude code 未发布能力
感觉过个两周,每个大厂人手一个顶尖 Agent 产品要发布
“正在自研世界一流Agent”
Claude Code 分析 Claude Code 何尝不是一种 NTR
逐字学习 https://twitter.com/op7418/status/2038986436884787282/photo/1
Claude Code 也能使用前几天 Anthropic 发布的 Computer Use 了 你可以用它这个能力来自己去验证一些 UI 上的问题:验证编码中的一些 UI 走查,模拟人工点击的链路测试 它也可以操作: 已经编译的 SwiftUI 应用 本地的、跨平台的应用 完全没有 CLI 的一些其他应用 Pro 和 Max 账号能用,三方的 API… https://twitter.com/op7418/status/2038816552183808128/video/1
Claude Code 也能使用前几天 Anthropic 发布的 Computer Use 了 你可以用它这个能力来自己去验证一些 UI 上的问题:验证编码中的一些 UI 走查,模拟人工点击的链路测试 它也可以操作: 已经编译的 SwiftUI 应用 本地的、跨平台的应用 完全没有 CLI 的一些其他应用 Pro 和 Max 账号里用,三方的 API… https://twitter.com/op7418/status/2038816463285551143/video/1
Claude 也能使用前几天 Anthropic 发布的 Computer Use 了 你可以用它这个能力来自己去验证一些 UI 上的问题:验证编码中的一些 UI 走查,模拟人工点击的链路测试 它也可以操作: 已经编译的 SwiftUI 应用 本地的、跨平台的应用 完全没有 CLI 的一些其他应用 Pro 和 Max 账号里用,三方的 API… https://twitter.com/op7418/status/2038816426870603824/video/1
Claude Code 的自动审批模式已经在新版本中对企业用户和我们这些用三方 API 的用户开放了。
Claude Code 最近是真不当人。 很多人反馈自己的 Token 额度消耗翻了 5 到 10 倍,甚至 20 倍。 有个 Reddit 用户逆向了一下 Claude Code 的代码,发现有两个可能导致缓存失效的 bug。 这大概解释了为什么(Token 消耗)刚好是这个倍数,因为缓存了的 Token 比没缓存的 Token 大概便宜 10 到 20… https://twitter.com/op7418/status/2038799533921226931/photo/1
昨晚果子(Apple)在中国推送了 Apple Intelligence。 然后早上古尔曼(Mark Gurman)说是失误,本来不应该上线的,现在已经被下掉了。 但是很多人说,升级 iOS 26.4 以后依然可以更新和安装,而且这个功能没有被关闭,想要体验的可以试试。 https://twitter.com/op7418/status/2038794973932576782/photo/1
OpenAI 现在比 Anthropic 开放多了! 现在能在 Claude Code 里调用 Codex 帮你审查代码! 省得我来回复制了,还想自己写一个来着,没想到官方的就来了。 Open AI 出了一个官方插件,可以帮你在 Claude Code 里调用 Codex 总共支持 3 个命令: /codex:review 运行标准的只读 Codex 审查。… https://twitter.com/op7418/status/2038793945053098484/photo/1
几天没发视频,上抖音一看,1 万粉了。 https://twitter.com/op7418/status/2038560632677515452/photo/1
企业微信甚至都做了 MCP! 写了一篇文章分析了一下,为什么一夜之间大家都开始做 CLI 了,甚至是国内这些以封闭著称的厂商。 从 CLI 为什么突然变重要,到如何为 AI 构建 CLI。 和我在 CodePilot 里让 AI 管理自己工具的实验。 而且对关键概念都做了解释,即使你是个小白也能看懂。
https://x.com/i/article/2038446555842379776
生成式 UI 的持久化看板,你甚至能给你的每个项目搭建一个专属的 UI 界面,里边的数据也是实时更新的。 这个东西非常牛逼,朋友们,理论上你能在 Code Pilot 里面再造一个 Code Pilot https://twitter.com/op7418/status/2038214645258047981/photo/1
昨天最牛逼的开源项目 Pretext 快速而且精准的文本测量算法,可以实现类似报纸的动态图文环绕效果。 这个对 AI 时代的 UI 实时生成非常有用。 有了这个以后,AI 就能清楚地知道每个字符的宽度和总宽度,不会出现闪烁、超出范围和抖动等问题。 https://x.com/_chenglou/status/2037714574057898427/video/1
装上飞书这个 CLI,再装上藏师傅的 Claude to IM Skill。 你的 Claude Code 和 Codex 飞书协作的体验比小龙虾好一万倍!
藏师傅在 CodePilot 里做了一个 AI-native CLI 管理系统! 新发布的网易云 CLI、飞书 CLI 和即梦 CLI,都可以在 CodePilot 一键安装和使用! 在对话中告诉 AI 你想装什么工具,它会自动执行安装、处理权限问题、引导认证配置、生成工具简介。 每个 CLI 工具有 Agent 友好度评分(★★★★★)。… https://twitter.com/op7418/status/2037842041754038301/photo/1
飞书真牛逼,刚刚开源了他们的 CLI 工具! 现在任何的 AI Agent 产品都可以调用飞书的所有能力。 飞书现在是全国所有产品里边,AI Agent 的友好度和开放程度、产品适配度都是最高的。 不只是小龙虾,哪怕是 CodeX、Claude Code 或者是其他类似的本地 AI 产品。… https://twitter.com/op7418/status/2037838579372896631/photo/1
CodePilot 0.40.0 版本应该是第一个全面拥抱 CLI 浪潮的 Agent 的产品! 内置了很多AI 友好的 CLI 工具,有老牌的 FFmpeg,也有新增的 Strip 和网易云音乐。 同时,AI 能够帮你完成 CLI 工具的安装和入库,以及它清楚地知道应该如何使用这些工具。 https://twitter.com/op7418/status/2037573637319090188/photo/1
牛批,谷歌 Chrome 有竖向标签栏了 启用方式,地址栏输入 chrome://flags/#vertical-tabs 启用后重启浏览器,然后在标签栏空白区域选择“将标签页移到侧边” https://twitter.com/op7418/status/2037570241144967222/photo/1
Anthropic 又要发新模型了 很难想象这个比 Opus 大的 Mythos 会有多贵 https://twitter.com/op7418/status/2037565551695016013/photo/1
收到了 @vista8 乔木和姚金刚写的 GEO 的书 感觉无论是不是需要营销的,哪怕是从防范的角度,也需要了解一下这部分信息。 你可以不营销,但是别人会抢你的量。 所以在这块儿,乔木和金刚还是很专业的,推荐找个时间买来看看。 https://twitter.com/op7418/status/2037463994353775102/photo/1
Claude 非常懂事,知道周五了,又挂了 https://twitter.com/op7418/status/2037462800478716202/photo/1
Anthropic 又 tm 改账号的额度消耗方式了 与此同时,CodeX 全天候接下来一周所有用户都有两倍的额度,Open AI 🐂🍺 总额度是不变的,但是在高峰期,你的账号额度会消耗得更快。 所以逼用户把任务放在非高峰期去跑,而且这里的高峰期是按 PT 和 GMT 定义的。… https://twitter.com/op7418/status/2037358982399148295/photo/1
Stripe 也转向了为 Agent 构建 而且他们推出的也是 CLI,而不是 MCP 或者 SDK 这种东西 Stripe CLI 中新增了一个插件 Stripe Projects 升级到付费计划时,Stripe CLI 可以通过 Shared Payment Token 机制帮你把一次录入的支付方式安全地授权给各服务商完成扣费… https://twitter.com/op7418/status/2037357646983143507/photo/1
果子突然变得这么开放 有消息称在 iOS 27 里,Siri 将变成一个 AI 中枢,可以把请求转发给通过 App Store 安装的第三方大模型或 AI 助手 Siri 本身会迎来一次大改版,新增独立应用(Siri app)、更接近聊天机器人的界面,以及系统级的“Ask Siri”入口(例如在系统菜单中一键把当前内容发给 Siri)。… https://twitter.com/op7418/status/2037354938284831161/photo/1
Cline 新推出的 Kanban 有意思啊 支持让每个任务自动在单独的 Worktree 中运行,并用看板卡片来管理任务和依赖,还能查看每个 Diff 可以让多个 agent 并行自主完成大量工作,同时提供分支和提交历史可视化 可以兼容 Claude Codex 和 Cline 本身 https://twitter.com/op7418/status/2037352649419620440/video/1
Codex 终于支持 Plugins 插件了 而且内置了不少有用的插件比如 Slack、Figma、Notion 等 插件在 Codex App、CLI 和 IDE 扩展中通用 而且也内置了插件创建的功能。 点击插件页面右上角的“创建插件”,然后跟 Codex 说你要创建什么类型的插件就可以了。 https://twitter.com/op7418/status/2037343745507823968/photo/1
I just claimed my .agent domain and joined the .agent community! get yours now and help shape the future of autonomous agents https://agentcommunity.org/join#5YRBCO28 @agentcommunity_
中文: 我刚刚申请了我的 .agent 域名,并加入了 .agent 社区!立即了解您的内容,帮助塑造自主代理的未来 @agentcommunity_
Twitter 的分成收益算法又要改了,会提高本地区曝光的权重 同样的浏览,如果你的受众跟你的语言、地区或者相邻国家一致,那么你的分成比例就是正常的 如果你的内容受众和你所在的地区、所发的语言不一致,那你获得的收益就会大幅减少。… https://twitter.com/op7418/status/2036633979064025493/photo/1
Codepilot 0.39.0 更新 - 统一上下文层,消除冗余 MCP 加载 - 计划模式:Tabs 切换 UI、状态持久化 - Bridge 升级:CLI 工具上下文注入 + 补齐 SDK 选项 - 侧边栏三点菜单:项目支持删除,分屏移到三点菜单里 - 侧边栏窄宽度修复:ScrollArea display:table 溢出问题 https://twitter.com/op7418/status/2036620002095464936/photo/1
Claude Code 新增了一个自动模式 终于不需要你对每个文件处理和命令执行进行审批了! 安全防护会在每个操作运行前进行检查,比以前的全部跳过权限审批更加安全 使用 claude --enable-auto-mode 启用,然后按 Shift+Tab 切换到这个模式 https://x.com/claudeai/status/2036503582166393240/video/1
Claude Code 新增了一个自动模式 终于需要你对每个文件处理和命令执行进行审批了! 安全防护会在每个操作运行前进行检查,比以前的全部跳过权限审批更加安全 使用 claude --enable-auto-mode 启用,然后按 Shift+Tab 切换到这个模式 https://x.com/claudeai/status/2036503582166393240/video/1
这个好玩🤩 3D 软件公司 Spline 发布了一个可以用 AI 帮你创建任何 3D 网页的产品 omma 聊天就可以创建非常炫酷的 3D 效果或者网页 3D 游戏,里面的代码和模型都是 AI 生成 https://x.com/splinetool/status/2036517448112021863/video/1
笑死,新版的 OpenClaw 因为更新了插件系统,导致微信的插件连接用不了了。 但是咱们这个还是可以用。
Claude Code 和 CodeX 远程连接到飞书 IM 的插件 Claude-to-IM-Skills 更新了! 将你的 Claude Code 和 CodeX 远程连接到微信! 而且配置方式极其简单:它会自动打开一个网页,你扫码就行。 https://twitter.com/op7418/status/2036260385490346133/photo/1
Claude Code 更新了新的 /init 命令 现在运行不只会帮你写 Claude.md 还会扫描你的代码库询问相关信息,帮你配置对应的 Skills 、插件、Hook 将这段内容添加到 settings.json 开启:"CLAUDE_CODE_NEW_INIT": "1"
Openclaw 3.22 版本有个巨大的 bug, 打包的时候把网页的部分给漏掉了,导致没有办法打开网页。 建议更新到 3.23 版本,确实是 Vibe Coding,这也太草台了,我自己都不会出现这种问题。 顺便,Peter 在自动化构建的时候,也发生了跟我一样的问题。 就跟我写 Codepilot… https://twitter.com/op7418/status/2036256769429946567/photo/1
OpenClaw 昨天憋了一周的更新发布了,主要是插件系统的重构。 现在的更新项如下: 1. 现在支持在 ClawHub 里面安装插件。 2. 同时兼容 Codex、Claude 和 Cursor 的插件系统。 https://twitter.com/op7418/status/2036250151074013436/photo/1
Luma 发布了一个很厉害的图片模型 UN1 类似 Nano Banana 和 Midjourney 的集合体 支持常识场景补全、空间关系理解和合理的画面变化; 支持多图参考、风格迁移; 支持各种文化、审美、风格的图像生成和理解,尤其是对当代视觉文化和梗图的生成; 最重要的看起来支持中文; https://twitter.com/op7418/status/2036247992211292485/photo/1
现在都 CLI 和 Skills 化了,网易云音乐都有了 还是得感谢龙虾,让国内这些,把数据当成宝贝的公司一夜间都变得开放了 看了一下需要去网易云音乐注册个人开发者,然后开通权限才能使用。 功能比较全面,拉取红心歌曲、获取歌词、获取歌单等都可以,不过下歌应该是不行的。 https://twitter.com/op7418/status/2036081766411514031/photo/1
Codepilot 0.38.5 版本已经支持微信桥接 https://github.com/op7418/CodePilot/releases/tag/v0.38.5 https://twitter.com/op7418/status/2035872378673324446/photo/1
今晚上线 https://twitter.com/op7418/status/2035735415534256424/photo/1
微信这次也是急了,第一次这么快的追热点 上线 Openclaw 官方插件,只支持私聊 在“我-设置-插件”中启用微信 Clawbot 插件 然后在 Openclaw 安装后,扫描展示的二维码就能启用 目前正在灰度 我看看能不接到我的 Claude-to-im Skills 里面,让你的 Codex 和 Claude Code 也可以跟微信聊天 https://twitter.com/op7418/status/2035564154636087770/photo/1
刚才处理了一个 Codepilot 里面非常典型的服务商配置问题 这也是很多人说自己按官方文档配置却不生效的原因 比如这个,他说他配置完了,也配置对了,但没有反应。 但我检查了一下 Log 发现,他配置的那个链接是错的: 1. 他配置的是 OpenAI 的兼容链接,而不是应该在 Claude Code 的这种 Anthropic… https://twitter.com/op7418/status/2035180804410941655/photo/1
真离谱啊,Cursor 昨天发布的 Composer-2 居然是基于 K2.5 训练的 他们的博客写得感觉像是他们训练从零的一样 而且到底基于 K2.5 做了多少程度的训练,其实也没有说清楚。 不过 Kimi 也解释说,他们给了技术授权。 https://twitter.com/op7418/status/2035165486628184468/photo/1
Claude Code 官方远程连接 Telegram 和 Discord 插件配置流程。 具体的操作方式 - Telegram: 创建机器人: 在 Telegram 中打开 BotFather,创建后复制他给你的 Token 安装插件: /plugin install telegram@claude-plugins-official 配置 Token: /telegram:configure <token> 使用命令启动:… https://twitter.com/op7418/status/2034819697858978070/photo/1
Claude Code 推出了官方可以远程连接 Telegram 和 discord 的 MCP 直接设置就可以用手机远程控制 CC https://x.com/trq212/status/2034761016320696565/video/1
飞书做了一个超安全且功能更强大的龙虾! 前段时间,龙虾爆火的时候,飞书因为健全的生态和开放的接入方式,成为了大家国内接入龙虾的首选 IM 平台。 但是毕竟 龙虾 有自己的体系,还有很多安全性问题,所以导致飞书服务的 to B 企业其实很多时候很难自己部署,或者是不敢自己部署。… https://twitter.com/op7418/status/2034584589986042298/photo/1
试了一下 LibLib 发布的这个 LibTV,这个有点厉害啊! 尤其是 Skills,感觉突然开窍了。 他们做了一个 AI 视频创作平台。这个系统是同时面向人类和 Agent 设计的: 人类可以操作、Agent 也可以操作、人类和 Agent 还可以相互协作 具体包括两个部分,网站和 Skills。 首先网站:… https://twitter.com/op7418/status/2034567141819613664/photo/1
早上就发了个小米的新闻,微信公众号那边,他妈的,那评论区乌烟瘴气的,都不能看。 很多翻起来还是关注了一年多的老粉。我在想,这帮逼关注了一年,关注点啥呀?我操,真丢人,教这些人
Codepilot 0.38.3 版本已经支持刚发布的 Xiaomi MiMo-V2-Pro 和 MiniMax M2.7 模型 而且小米这个模型未来一周会免费,各位可以来 Codepilot 玩了 只需要在服务商中填入你的 API Key 就行 https://twitter.com/op7418/status/2034406550970970413/photo/1
小米这波牛逼啊,一下掏出三个顶级模型! 前几天在 OpenRouter 杀疯了的 Hunter Alpha 就是 MiMo‑V2‑Pro! MiMo‑V2‑Pro 旗舰模型: 主要在 Agent 能力和代码能力上很强。 MiMo‑V2‑Omni: 多模态感知模型,负责感知环境为 Agent 模型提供信息。 MiMo‑V2‑TTS: TTS 语音模型负责 Agent 跟人类沟通… https://twitter.com/op7418/status/2034404031758839851/photo/1
Claude Code 创建者写的如何使用和创建 Skills 如果你还不了解的话,强烈推荐看看! Anthropic 内部现在有数百个 Skills 在用,从 API 文档到部署流程全覆盖。他们把这些经验总结出来了。 做个笔记📒: ====== Skills 不只是 Markdown 文件 很多人以为 Skills 就是写个 Markdown… https://twitter.com/op7418/status/2034082485798314489/photo/1
Open AI 发布了 GPT-5.4 Mini 和 Nano 两个模型 把 GPT‑5.4 能力下放到更快、更便宜的小模型,用来当“执行层”和子 Agent 主力。 GPT‑5.4 mini: - 定位即时响应的代码助手 - 大模型规划 + mini 并行执行的子智能体 - 解析复杂 UI 截图的 computer use - 代码、推理、多模态、工具使用都有明显提升… https://twitter.com/op7418/status/2034074865226207510/photo/1
Midjourney V8 模型终于发布了! 跑了几张图试了一下,发现基础的提示词风格跟 V7 有差别,但是不多。 可能增强在那些定制化的审美表现上吧。 具体官方发布的更新内容有: 在复杂提示词遵循上更强 图像更连贯,更理解你的审美偏好 文字渲染更好。 个性化风格参考在情绪板上的效果也大幅增强。… https://twitter.com/op7418/status/2034069787719176219/photo/1
试了一下智谱刚出的 GLM-5-Turbo 模型,挺牛逼啊,太强了,又快又好! 这个模型是专门用来面向 OpenClaw 这种 Agent 的场景深度优化的。 输出速度非常快。它的提示遵循和工具链调用很稳定,在前端的表现上也不错。… https://twitter.com/op7418/status/2033898407824396385/photo/1
Kimi 昨晚这篇论文很猛 尝试用 K2.5 对 Kimi 这篇论文进行可视化解释。 https://twitter.com/op7418/status/2033708252681392213/photo/1
Codex 现在支持创建 Subagents 而且你还能切换窗口很便捷的跟踪每个Subagents 正在做的事情 https://x.com/OpenAIDevs/status/2033636701848174967/video/1
果然,Agent 只要有新形态,Manus 就会跟进。 他们发布了 My Computer,可以在你本地运行 AI Agent,操纵你的本地文件、运行自动化工作流。 有 Window 和 Mac OS 版本。 https://x.com/ManusAI/status/2033558672152854712/video/1
受这位朋友的启发,发现了生成式 UI 的一个非常好的用法!非常牛逼! 就是跟我的 Codepilot 助理一起使用。 它可以可视化助理这周记忆的内容,帮你分析你这周还有什么东西没做,以及已经做了哪些。 比如你的助理记了你的很多 to-do list… https://twitter.com/op7418/status/2033558061831590353/photo/1
受这位朋友的启发,发现了渐进式 UI 的一个非常好的用法!非常牛逼! 就是跟我的 Codepilot 助理一起使用。 它可以可视化助理这周记忆的内容,帮你分析你这周还有什么东西没做,以及已经做了哪些。 比如你的助理记了你的很多 to-do list… https://twitter.com/op7418/status/2033558020119228526/photo/1
终于腾出手来解决 Codepilot 服务商连接的老大难问题了,上了个诊断,还能自动帮你修复 如果你以前用 Codepilot 有连接问题的话,可以下这个版本试试 对已有用户无破坏性变更。 现有配置、会话、provider 数据全部保留,行为向后兼容。具体变化: - 新建聊天会记住上次选择的… https://twitter.com/op7418/status/2033483608946770289/photo/1
好事啊,香港以后很快就能用 Gemini 了,希望谷歌的其他服务也能开放。 https://twitter.com/op7418/status/2033452073170473033/photo/1
把生成式 UI 的能力做了个 Generative UI MCP 可以让其他的 Agent 产品也支持在聊天中输出这种交互式的生成式 UI 解释。 可惜的是,目前支持这种在聊天页面流式渲染 SVG 或者 HTML 的产品还是太少了。 我试了一下,就在 Craft Agent 里面可以,但是体验也比 Code Pilot 差了不少,Claude… https://twitter.com/op7418/status/2033412485433500130/photo/1
过去 30 天 Token 消耗总量为 1.4 亿 其中春节几天几乎没有工作 https://twitter.com/op7418/status/2033389923664027937/photo/1
重点是这个项目只有藏师傅一个人。 我去,那在年前很难想象我能够有一周十万行代码的能力,而且这个速度还在提升,bug 的几率还在下降。 而且我这样,都没有把 Max 会员 200 美元的额度用完。 很难想象那些一个月跑十几亿 token 的朋友咋用
太猛了,朋友们!Codepilot 上周数据如下: 1. 总共 10 万行代码提交 2. 73 次 Commit 3. 一周 8 个版本 4. 近两周 PV 达到了 5 万次 5. Github Star 3900 https://twitter.com/op7418/status/2033377690464731150/photo/1
朋友们,Claude-to-im Skills 也更新了! 现在可以让你的 Claude 和 Codex 链接飞书有飞书官方 Openclaw 插件的全部能力 而且引导更加详细,会告诉你需要补的权限 支持:流式卡片输出、工具调用进度 、权限审批按钮、项目快捷切换、Thinking 状态等 https://twitter.com/op7418/status/2033202960843563484/photo/1
对比了一下我的和他的实践,不过他不是给真的产品做,不考虑这些也无可厚非 https://twitter.com/op7418/status/2033161018688631267/photo/1
真受不了微信公众号的傻逼氛围了 每次发文章固定 NPC,这玩意有什么用?我为什么不用官方 APP 艹了,也没拦着他用啊
藏师傅太牛了! 一天时间复刻了 Claude 刚出的生成式 UI 功能! AI 直接在聊天里画交互式图表,帮你解释和分析相关信息。 流式输出,边生成边渲染。 感兴趣可以在 Codepilot 里面体验,文章里有实现的方案细节。 https://twitter.com/op7418/status/2033114800897880256/video/1
https://x.com/i/article/2033111625419685888
牛逼,还是得有竞争。Claude 被 Codex 卷到了! 接下来两周工作日非高峰时段的所有用户的用量翻倍,然后周末所有用户的用量全天翻倍 高峰时段换算成北京时间的话,就是 20:00–次日 02:00 这段时间,其实跟我们没啥关系。 国内用户在白天的所有时段,用量其实都是翻倍的。 https://twitter.com/op7418/status/2033083402136813614/photo/1
Codepilot 的飞书桥接服务更新了! 现在几乎可以拉齐飞书官方插件在聊天里的所有体验 流式输出、卡片式结果、带按钮的权限通知卡片 而且我还优化了切换工作目录和新开聊天的体验 现在可以在飞书里面切换工作目录和新建聊天了 更新 0.36 版本并在飞书后台补充对应权限就可以用了 https://twitter.com/op7418/status/2032745670382334455/photo/1
牛逼,还是得有竞争 现在一百万的上下文的 opus 和 Sonnet 是 max 和 team 账号的默认模型了 https://twitter.com/op7418/status/2032629882904334715/photo/1
同时也优化了 Codepilot 这部分文档的写作方式 它更像是一个教程,尤其是增加了一些基础概念的解释。 如果你是一个小白的话,也可以根据这些文档去理解和使用这些功能。 https://twitter.com/op7418/status/2032296560877539831/photo/1
CodePilot 0.34.2 版本已经支持了所有的 Git 能力 你可以可视化的管理当前项目的 Git 进行提交、推送、分析差异以及创建和派生工作树 https://twitter.com/op7418/status/2032294963703349623/photo/1
Obsidian 剪藏插件更新了不少东西,同时还改了 AI 标注的语法 顺便更新了一下我的剪藏模版,现在多了一个分类,摘要除了内容总结还有核心价值洞察 https://twitter.com/op7418/status/2032150608984359295/photo/1
Codepilot 更新了 0.33.0 版本 修复了一大堆这几天大家反馈的问题。 比如插件系统的问题,还有关于思考模式和 100 万上下文的设置问题。 以及首次安装 Claude Code 引导的问题,现在改成了原生安装,不会再让你装 Node. js了。 https://twitter.com/op7418/status/2032088548946637006/photo/1
Obsidian 剪藏工具,现在居然可以收藏 YouTube 视频的时候,连视频字幕一起收藏下来,这个也太爽了! https://twitter.com/op7418/status/2032082742071193872/photo/1
在 Meta 被小扎开除之后的杨乐坤(Yann LeCun)创办了一个新的公司 AMI Labs。 拿到了现在应该是最多钱的种子轮,共计 10.3 亿美元。 他看不上大语言模型这一套,所以他的目标是创建一个能够真正理解现实世界、能够长期记忆并进行规划的智能系统。… https://twitter.com/op7418/status/2032016233172992083/photo/1
小龙虾套壳的风波终于是卷到了国外 Perplexity 出了一个 Personal Computer,马斯克也说要做类似的东西 在你的电脑里有一个长期稳定的助手,一个可以操作软件和文件的客户端。 跟一个配置好的 Open Claw 能做的事情差不多。 但比较好的是,它的交互非常舒服: 1. 你可以直接语音输入 2.… https://twitter.com/op7418/status/2032011204030578940/video/1
没忍住买了新的 Studio Display ,为了更方便的 Vibe Coding 可以用一根线和一个显示器控制我的 MacBook 和 Mac mini。 我才知道可以通过雷电 5 去连接屏幕共享,实现高分辨率下 Mac mini 和 MacBook 的相互控制。 而且还能相互粘贴文本和拖放文件,这个太顶了! https://twitter.com/op7418/status/2031928728121754107/photo/1
Claude Code 又出问题了,我目前正常使用
有人需要 CodePilot 移动端 App 吗? 这个手机端能控制你多个桌面端设备的 Code Pilot,或者是 Claude Code 和 Codex。 你能够在多个桌面端进行多个聊天窗口并发 桌面端的桥接会更加稳定,然后也可以拉起桌面端。APP…
Deepseek 终于不像贾跃亭一样永远下周了? https://twitter.com/op7418/status/2031758448866775333/photo/1
给 Codepilot 加上了 CLI 工具的推荐和一键安装 现在大家开始都给 AI 制作 CLI 工具了 你电脑上的其他已经安装的 CLI 工具也可以调用 AI 生成介绍 CLI 工具也是 Agent 基建之一 https://twitter.com/op7418/status/2031709787361292648/photo/1
真服了,现在下面这么多自动回复的 AI。 自动回复一眼就能看出来,好歹调也调得好一点,好好调调你的提示词。 以后再有这种,看见一个拉黑一个。
现在我的助理会每天早上读取邮件,给我一个报告 https://twitter.com/op7418/status/2031596172427845839/photo/1
这个流程非常爽: 1. 跟人约了时间,截图发给飞书 2. 飞书发给你电脑的 Claude Code(或者是我的 Code Pilot) 3. Code Pilot 会把日历直接同步到谷歌日历上去 一个截图发过去,什么都不用说就搞定了! 谷歌的 CLI 有些问题,我让 AI 总结了一下这些可以避免的坑👇: https://twitter.com/op7418/status/2031590683770028344/photo/1
谷歌新出的这个 Workspace 的 CLI 工具太好用了呀! 我用 Codepilot 的助理模式,可以自动把我所有的日程同步到谷歌日历里。 这样的话 AI 知道我的日程,我也能方便地查看自己的日程。 有什么事就直接通过飞书远程连接截个图发给它,然后它就帮我创建日程了。 谷歌日历上面也就同步了,非常完美。 https://twitter.com/op7418/status/2031589335552884843/photo/1
Codepilot 终于有官网了朋友们! 藏师傅下午 Vibe Design 了一下,文档网页也上线了 https://www.codepilot.sh/ https://twitter.com/op7418/status/2031363798943281191/video/1
Codepilot 终于有官网了朋友们! 藏师傅下午 Vibe Design 了一下,文档网页也上线了 https://claudepilot.sh/ https://twitter.com/op7418/status/2031363715229167804/video/1
搞抽象这块还是得向陈抱一学习呀,我去,太牛了这用法 谁不想要一个每天早上控制全屋设备叫你起床的猫娘助理呢? https://twitter.com/op7418/status/2031210541553959134/video/1
可以帮你的 ClaudeCode 和 Codex 连接飞书、QQ 的 Claude-to-im Skills,做了个易用性改动 需要授权的时候不用写超长命令了,现在只需要回复 1、2、3 就行 https://twitter.com/op7418/status/2031185661265588338/photo/1
受邀参与了小米的小龙虾 Miclaw 的测试。 ​我一屋子的小米设备终于派上了用场! ​ ​这玩意确实顶,Agent 终于有了接触现实世界的触手。 小米的估值逻辑得改改了
https://x.com/i/article/2030949947450003456
现在每个厂家一个自己实现的 OpenClaw 套壳。 ​ ​说实在了,与其一星期 Vibe Coding 一个全是bug的东西出来,不如买藏师傅的 CodePilot 源码或者买我的授权了。 ​ ​藏师傅还能给你定制 UI 和换皮呢。
终于给 CodePilot 做了设计师该做的功能! 现在支持精心配置的 13 套主题切换,都区分亮暗模式! 灵感来自比较流行的 Vscode 主题再演绎 现在咱这个产品的颜值真的拉满,你也可以自己设计自己的主题,后面会支持加载 https://twitter.com/op7418/status/2030861559862644783/video/1
笑死 Codex 批评 Claude Code 干活敷衍 只管当前的问题修复,不管修复带来的影响 https://twitter.com/op7418/status/2030849634600616218/photo/1
Claude Code 新增的 /loop 命令猛啊 可以连续三天帮你执行重复性任务,最细的粒度可以到每五分钟执行一次 这下把 Openclaw 的定时任务也搞来了,比如可以帮你定时审查 github 的 PR 或者每天帮你总结相关信息进行提醒 结合我的 Feishu 或者 Telegram Skills… https://twitter.com/op7418/status/2030549756565667859/photo/1
Codepilot 和 Claude-to-IM-Skills 都已经支持了 QQ 进行远程控制 QQ 这次的改动真不错,只需要一步就可以获取到需要的 ID 完全不需要用户在开发者后台走繁琐的授权流程,应该是小白最友好的了。 https://twitter.com/op7418/status/2030317806689120577/photo/1
哈哈 Claude-to-im Skills 和 CodePilot要适配QQ吗 https://twitter.com/op7418/status/2030200150874800231/photo/1
谷歌的这个 CDP MCP 实在是太方便了,我去! 完全可以让 AI 自动进行设计走查和交互的测试。如果你有设计稿的话,它的自动设计走查会更加精准和精确! 再搭配上设计系统,基本上一次生成加多次走查就能完全搞定 UI 和交互的测试,不需要人工再干预。 https://twitter.com/op7418/status/2030184230630871457/photo/1
Anthropic 服软了
Claude Code / Codex CLI into OpenClaw chat with your AI coding agent from Telegram or Discord. Streaming responses · inline permission buttons · persistent sessions · zero config code. <npx skills add op7418/Claude-to-IM-skill> https://twitter.com/op7418/status/2029950690848821373/photo/1
中文: 克劳德代码 / 代码 CLI 进入 OpenClaw 与来自 Telegram 或 Discord 的人工智能编码代理聊天。 流媒体响应 · 内联权限按钮 · 持久会话 · 零配置代码。 &lt;npx 技能新增 op7418/Claude-to-IM-skill&gt;
有朋友说,我开源了连接 Claude Code 和Codex 的 Skills 以后,小红书突然多出了很多类似的项目 哎,麻了
Codepilot 的长期记忆和助理功能搞定了 https://twitter.com/op7418/status/2029942220510613957/photo/1
https://x.com/i/article/2029562855511744512
少解构多建构