想转型做 AI 基础设施工程师,网上的资料过于零散,或者只讲理论没有实操。 无独有偶,在 GitHub 上发现一份开源的初学者学习路径:AI Infra Engineer Learning。 整个课程分 10 个模块,从容器化、Kubernetes 到 GPU 计算、大模型基础设施,循序渐进,每个模块都配有代码练习和测验。… https://twitter.com/GitHub_Daily/status/2064248666588954768/photo/1
Google 把自家产品的相关操作打包成了技能库 Agent Skills,并开源。 涵盖 Gemini API、BigQuery、Cloud Run、Firebase、Kubernetes 等多个核心产品。 还提供了 Google Cloud 架构良好框架的安全、可靠性、成本优化等多个维度的指导。 GitHub:https://github.com/google/skills 装上相关产品的技能后,能让… https://twitter.com/GitHub_Daily/status/2064195807285514510/photo/1
想让 AI 帮忙复刻某个网站的设计风格,光靠截图描述效果不是很好,像颜色、字体、间距这些细节很难精准复刻。 最近看到一个命令行工具 skillui,能逆向分析任意网站的前端设计,然后打包成 AI 可直接读取的文件。… https://twitter.com/GitHub_Daily/status/2064167532140077399/video/1
最近看到一个开源的终端仪表盘:glint,可同时盯股票、看天气、刷新闻、收邮件等十几种常用信息源。 首次启动会有个设置向导,选好布局和组件就能用,所有配置都是本地 TOML 文件。 全程支持键盘操作,按下快捷键就能在不同面板间快速跳转,甚至能直接浏览图片和记录笔记。… https://twitter.com/GitHub_Daily/status/2063976881783984142/photo/1
做投资每次想复盘交易表现,导出的 CSV 报表密密麻麻一堆数据,光是整理就让人头大。 最近找到 IBKR Analytics Studio 这个工具,能直接在浏览器里解析盈透的报表文件,自动生成可视化的分析页面。 把导出的 CSV… https://twitter.com/GitHub_Daily/status/2063924017845989464/photo/1
在 GitHub 上发现 harness-anything,可以让 AI 直接操作 WPS、Photoshop、Illustrator 这些桌面软件。 提供一套标准化的命令行工具,共 47 个命令,接管操作本地的办公和设计软件。 不仅能让 AI 写 Word、建表格、生成带排版的 PPT,还能直接在 PS 和 AI 里新建图层、画矢量图、导出设计稿。… https://twitter.com/GitHub_Daily/status/2063886273346162750/photo/1
微软最近开源一个 AI 终端:Intelligent Terminal,基于 Windows Terminal 开发,在终端里内置 AI 助手。 可以自动感知命令行的输出,报错时一键把上下文丢给 AI 分析,不用手动复制粘贴,还能直接帮执行修复命令。 GitHub:https://github.com/microsoft/intelligent-terminal 支持 GitHub Copilot、Claude… https://twitter.com/GitHub_Daily/status/2063863614508044332/photo/1
在给产品接入第三方 API,或者让 AI 智能体调用外部工具时,处理各类 OAuth 授权和刷新 Token 颇为麻烦。 为了少造轮子,可以直接使用 Nango 这个开源集成平台,专门帮我们搞定这些繁琐的对接工作。 内置了 800 多个主流 API 的授权管理,开箱即用,省去了手写复杂登录流程的麻烦。… https://twitter.com/GitHub_Daily/status/2063833415364002231/photo/1
又发现一款 Obsidian 的开源平替 Tolaria,专门管理 Markdown 知识库,作者自己用它打理上万条笔记。 它的核心思路是文件即数据、Git 即同步。笔记就是普通 Markdown 文件,每个知识库本身就是一个 Git 仓库,版本历史和远程备份天然就有。 GitHub:https://t.co/QAxlnQYgLj… https://twitter.com/GitHub_Daily/status/2063614493763268684/photo/1
剪辑视频想从一段长视频里挑出精彩片段、裁成竖屏、加字幕、写文案、再分发到各大平台,流程又长又琐碎。 最近看到 Shortcast 这个开源工具,能把长视频自动拆成可以直接发布的短视频,整个过程全在本地完成,不上传任何内容到云端。… https://twitter.com/GitHub_Daily/status/2063561606118941052/video/1
在 GitHub 上发现一个开源的学习工具:Get It,可帮助我们通过多种方式深度学习 PDF 文件内容。 自动在 PDF 文件上标注关键概念,还可转化为 3D 模型、动画演示、公式推导等可视化内容,同时生成一张知识图谱。 GitHub:https://t.co/aNCciw09l2… https://twitter.com/GitHub_Daily/status/2063523855508160949/video/1
想要长期定投吃股息,用表格手动记录数据太繁琐,而市面上的商业追踪软件不仅收费,还容易泄露隐私。 无独有偶,看到一款专为长期投资者打造的本地股息投资组合追踪工具:SALARY-2045。 接入雅虎财经等数据源,帮我们直观展示总价值、年化股息收入以及被动收入目标的达成进度。 内置未来 12… https://twitter.com/GitHub_Daily/status/2063493686034649187/photo/1
最近很多大学生毕业找工作,查看了上百个岗位,并挨个改简历,每天精力全耗在筛选上。 可以试下用 Career-Ops 这个项目,构建一套求职指挥系统,作者靠它筛了 740 多个岗位,最终拿下了心仪的 offer。 只需粘贴一个职位链接,系统自动完成岗位评估、简历定制生成和进度追踪,整个流程一条命令搞定。… https://twitter.com/GitHub_Daily/status/2063471069915406723/photo/1
想对 PDF 文件做些标注、合并拆分等这些基本操作,还得装个臃肿的 Adobe 全家桶,或用各种在线工具把文件传上去,总觉得不太放心。 偶然找到了 KillerPDF 这个开源工具,只有 6MB 左右大小,直接开箱即用,完全本地运行处理。 涵盖合并拆分、文字编辑、手绘批注、电子签名、插入图片、裁剪页面、加密… https://twitter.com/GitHub_Daily/status/2063252108934295640/photo/1
用 AI 写 React 代码确实快,但有时候会埋下状态管理或性能隐患,自己排查又太耗时间。 最近看到 React Doctor 这个工具,专门扫描 React 项目中的代码质量问题。 支持全面扫描代码库,覆盖状态管理、性能、架构、安全和无障碍访问等多个维度。 GitHub:https://t.co/NVlBaPsI38… https://twitter.com/GitHub_Daily/status/2063221924889768396/photo/1
今天在 GitHub 上刷到 GitType 这个终端打字游戏,还挺好玩的。 它能够将我们写的代码或 GitHub 项目转换成打字挑战,边练打字边复习代码。 进入项目目录运行一条命令,自动提取代码中的函数片段作为打字内容,可实时显示打字速度和准确率。 GitHub:https://github.com/unhappychoice/gittype 支持 20… https://twitter.com/GitHub_Daily/status/2063199253812711747/photo/1
用数据库存重要数据,最怕的就是改错了没法回退。传统数据库虽然有备份,但想精确回到某个时间点、看看谁改了哪条记录,颇为麻烦。 最近看到 Dolt 这个项目,提供了一个挺有意思的思路,把 Git 的版本控制能力直接搬进了 SQL 数据库。 完全兼容 MySQL 协议,用现有的 MySQL… https://twitter.com/GitHub_Daily/status/2063184150274908531/photo/1
想在本地跑大模型,不知道自己的显卡到底能跑哪个模型,选大了跑不动,选小了又浪费性能。 于是找到 whichllm 这个命令行工具,帮我们自动检测硬件配置,然后从 HuggingFace 上筛选出最适合自己机器的模型并排名。… https://twitter.com/GitHub_Daily/status/2063167243199156268/video/1
最近看到一个开源项目 Flipbook Canvas,挺有意思,能把每张 AI 生成的图变成一棵可以无限点击探索的知识树。 长按图片任意位置,系统会自动识别你点的内容,联网搜索相关资料,然后生成一张全新的详细图解,层层递进。 GitHub:https://t.co/tiDHRnQto5… https://twitter.com/GitHub_Daily/status/2062889733131526324/photo/1
微信读书用久后,积累不少笔记和划线,想导出整理一下,发现没有提供很方便的方式。 有位开发者,便开源一个工具 readNeo,给微信读书做了一个独立的数据面板。 接入官方的 Skill API,直观地可视化书架、阅读时长和趋势图表,直观了解自己的阅读习惯。 GitHub:https://t.co/tZkUd2Ind7… https://twitter.com/GitHub_Daily/status/2062836855457173969/photo/1
用 Figma 来做设计原型挺不错的 ,但有些公司对数据安全有要求,不允许把设计文件存在第三方服务器上。 可以看下,Penpot 这个开源设计平台,可作为 Figma 平替,支持自托管部署,设计数据完全掌握在自己手里。 原生支持 SVG、CSS、HTML… https://twitter.com/GitHub_Daily/status/2062799102094794950/photo/1
让 AI Agent 自动化操作浏览器或抓数据,经常被各种反爬机制拦截,遇到验证码、人机验证直接卡死。 最近 BrowserAct 团队开源了一个 Skill,专为 AI Agent 设计的浏览器自动化命令行工具。 提供三层反封锁机制,从指纹伪装、验证码自动破解,到 AI… https://twitter.com/GitHub_Daily/status/2062746268993216772/photo/1
做机器人、自动驾驶这类物理AI开发,训练模型需要大量真实世界数据,采集成本高,合成数据质量又常常不够用。 最近 NVIDIA 开源了 Cosmos 3 这个世界模型平台,能同时理解和生成文本、图像、视频、音频甚至动作序列,一套模型搞定多种模态。… https://twitter.com/GitHub_Daily/status/2062708506323730652/photo/1
想系统学习深度强化学习,网上的教程大部分都是公式推导看得头疼,总觉得缺少循序渐进的实践引导。 偶然看到 Hugging Face 团队开源的 deep-rl-class 这门深度强化学习课程,理论和实战结合得很好,而且完全免费开放。 课程涵盖了 Q-Learning、策略梯度、PPO… https://twitter.com/GitHub_Daily/status/2062527343458169320/photo/1
GitHub 上 CodexSaver 这个开源工具颇为实用,它把 Codex 变成一个任务调度路由器,让便宜的模型干杂活,贵的模型只管拍板。 核心逻辑就是把代码解释、写文档、基础单测等低风险任务,自动分发给 DeepSeek 或本地小模型处理。… https://twitter.com/GitHub_Daily/status/2062474471160852568/photo/1
想学习操作系统底层原理,面对动辄几十万行的内核源码,看得头大,抓不住核心脉络,很难真正读完读懂。 偶然看到 egos-2000 这个教学操作系统项目,整个系统只有 2000 行代码,却实现了操作系统的所有核心组件。… https://twitter.com/GitHub_Daily/status/2062436717689483600/photo/1
刚用 Obsidian 搭建个人知识库,想找些现成的高质量模板参考一下,看看别人怎么组织内容的,但网上的资源又十分零散。 于是找到 Awesome Obsidian Vault 这份合集,把各种优质的 Obsidian 知识库整理成了一份清单,目前收录了 43 个库。… https://twitter.com/GitHub_Daily/status/2062383876786540891/photo/1
想弄一个能语音聊天的 AI 虚拟伴侣,大部分工具配置繁琐,而且必须联网,隐私数据很难让人放心。 最近看到 Open-LLM-VTuber 这个项目,能在本地完全离线运行一个带 Live2D 形象的 AI 语音伴侣。 不只是简单的对话,还能通过摄像头观察我们,支持语音打断、触摸互动,甚至能显示 AI 的内心想法。… https://twitter.com/GitHub_Daily/status/2062361530616955020/photo/1
做安全研究或渗透测试,最头疼的不是技术本身,而是知识太分散。 漏洞类型、利用手法、绕过技巧散落在各种wiki和笔记里,每次都要翻半天。 于是找到 hack-skills 这个开源技能库,把安全攻防知识系统性地整理成了 101 个可检索、可组合的技能卡片,专门为 AI Agent 设计。… https://twitter.com/GitHub_Daily/status/2062164968947208261/photo/1
知名 YouTube 博主 PewDiePie 最近开源一个的 AI 项目,不到三天时间暴涨 3.6 万 Star。 项目名叫 Odysseus,一个能完全在本地跑的 AI 工作台,把 ChatGPT、Claude 的聊天体验搬到我们的电脑上,所有数据都不出机器。 GitHub:https://github.com/pewdiepie-archdaemon/odysseus Agent… https://twitter.com/GitHub_Daily/status/2062112078312374287/photo/1
做情报收集或安全分析时,各种信息散落在不同平台,域名、IP、邮箱、社交账号之间的关联关系,靠手动整理很容易遗漏线索。 偶然看到 Flowsint 这个开源情报图谱工具,用可视化关系图来串联调查中的各类实体,让思路很清晰。 把域名、IP、邮箱、钱包等信息作为节点,通过内置的自动化… https://twitter.com/GitHub_Daily/status/2062074335574307087/photo/1
用 AI 编程工具干活,Token 消耗蹭蹭往上涨,工具输出、日志、代码文件一股脑塞进上下文,费钱不说,还容易撑爆上下文窗口。 最近在 GitHub 上看到 Headroom 这个项目,专门给 AI 智能体做上下文压缩,据实测能省掉 60% 到 95% 的 Token,而且不影响回答质量。… https://twitter.com/GitHub_Daily/status/2062021503198388714/photo/1
用 AI 智能体生产级事情,写代码、跑流程、调接口,一开始还行,但规模一大就容易失控,权限太宽、上下文丢失、调试无从下手。 于是找到了 agents-best-practices 这套完整的智能体运行框架设计指南,不限于编码场景,运营、销售、数据分析等领域同样适用。… https://twitter.com/GitHub_Daily/status/2061961080218480998/photo/1
用 AI Agent 处理复杂任务时,最头疼的不是模型能力不够,而是对话一长,上下文就容易爆。 还经常要给 Agent 解释背景和流程,以及调用工具产生的多余信息,更是在疯狂消耗 Token。 最近看到腾讯开源的 TencentDB Agent Memory 项目,专门解决了 Agent 的记忆问题,思路还挺有意思的。… https://twitter.com/GitHub_Daily/status/2061802514966618517/photo/1
做跨平台桌面应用,绕不开一个老问题,想兼顾效率和原生性能,往往会陷入两难。 在 GitHub 上看到一个开源解决方案 native-feel-skill,它把 Raycast 2.0 的技术方案拆解成了一套可复用的 AI Agent 技能。 安装后,当我们和 AI… https://twitter.com/GitHub_Daily/status/2061772336765051269/photo/1
在 Hacker News 上看到一个极简的开源笔记工具:files .md,定位为 Obsidian 的平替。 所有内容都是本地的 Markdown 纯文本文件,数据完全不离开你的设备。 而且打开浏览器就能用,不用安装任何东西,支持离线使用。 还可通过类似聊天的方式快速记录想法,再归类到笔记、日记或待办里。… https://twitter.com/GitHub_Daily/status/2061749683161280891/photo/1
录屏容易,但想让演示视频看起来专业,就得折腾后期剪辑。加个缩放、美化光标、套个好看的背景框,折腾半天。 偶然找到了 Recordly 这个开源工具,用它录屏和后期编辑一站式搞定,直接出成品级的演示视频,可作为 ScreenStudio 的开源平替版。… https://twitter.com/GitHub_Daily/status/2061734567116231071/video/1
用 Claude Code 做复杂项目,单个 Agent 能力有限,想让多个 Agent 协作分工,但手动配置团队结构和技能文件太繁琐。 最近找到 Harness 这个 Claude Code 插件,一句话描述你的项目,它就能自动生成一整套 Agent 团队架构。 内置 6… https://twitter.com/GitHub_Daily/status/2061711966947901450/photo/1
想学习网络安全,网上资料东一块西一块,工具、教程、练习分散在各处,整理资源都要花大半时间。 GitHub 上 h4cker 这个项目,由安全领域知名作者 Omar Santos 长期维护,提供一站式的网络安全资源库。 从攻防技术、云安全、应用安全到 AI… https://twitter.com/GitHub_Daily/status/2061236298569130465/photo/1
GitHub 上 KaliGPT 这个开源项目,在 Linux 命令行里接入 AI 助手,专门为网络安全学习设计。 一条命令就能启动对话,直接用自然语言描述需求,AI 会给出对应的安全工具用法和操作指导,还能调用工具执行任务。 GitHub:https://github.com/SudoHopeX/KaliGPT 支持 Gemini、ChatGPT、OpenRouter… https://twitter.com/GitHub_Daily/status/2061077748345696320/photo/1
想学大语言模型的底层原理,网上的教程要么纯讲理论,要么直接丢个开源模型让你微调,真正从零手写训练的实战教程太少了。 偶然找到 train-llm-from-scratch 这个项目,手把手教你用 PyTorch 从零实现一个 Transformer 模型,在单张显卡上就能完成训练。 从注意力机制、多层感知机到完整的… https://twitter.com/GitHub_Daily/status/2061024901012873583/photo/1
处理 PDF 文档解析,使用一些在线工具不仅解析速度慢,还容易丢失排版信息,想在本地快速提取带位置信息的文本,选择并不多。 最近看到 LiteParse 这个开源的 PDF 解析工具,主打本地运行、轻量快速,由 LlamaIndex 团队开发。 基于 PDFium 引擎做文本提取,内置 OCR… https://twitter.com/GitHub_Daily/status/2060987152113291557/photo/1
想学机器学习、深度学习或者 Python,网上资源虽然多,但质量参差不齐,好书散落在各个角落,一本本去找更是费劲。 偶然在 GitHub 上刷到 Books 这个开源电子书仓库,一口气整理了 200 多本编程类电子书,全部免费直接下载。 覆盖还挺广的,从 Python… https://twitter.com/GitHub_Daily/status/2060934305111781410/photo/1
想系统学习 AI,最头疼的不是没资源,书、课程、论文、工具到处都是,但不知道从哪看起。 有位开发者,把自己学习 AI 过程中用过的资料整理成了一份手册:AI-Study-Group,内容相当全面。 按书籍、课程、视频、工具、模型、数据集、论文等分类整理,每个资源都附带简短点评和推荐理由。… https://twitter.com/GitHub_Daily/status/2060873908614807758/photo/1
买了本技术书,认真读完一遍,过几个月再想翻找里面的某个知识点,找半天都找不到了。 于是发现 book-to-skill 这个工具,把书籍直接转成 Claude Code 的技能文件,随时调用查阅。 它首先会对整本书做一次深度分析,提取出核心框架、设计模式、术语表和速查手册。… https://twitter.com/GitHub_Daily/status/2060662514879483979/photo/1
斯坦福 REAP 团队,精心筛选整理了 23000+ Agent 技能库,覆盖 8 大社会科学学科的实证研究。 从选题、文献检索、数据清洗、因果推断,到论文写作、排版投稿、审稿回复,全链条覆盖。 核心是将资深学者的研究经验,直接编码成了结构化的自动化工作流。 GitHub:https://github.com/brycewang-stanford/Auto-Empirical-Research-Skills 能让 AI… https://twitter.com/GitHub_Daily/status/2060624769339523357/photo/1
想系统学习 AI,网上资源太多太杂,免费课、付费书、GitHub 项目,光是筛选和规划学习路线就够让人头疼了。 不妨看下 AI Learning Kit 这份合集,它把 AI 学习资料做了一次系统性的梳理和精选,从入门到进阶一站式整理好了。 整个合集按学习路径组织,从数学基础、Python… https://twitter.com/GitHub_Daily/status/2060571919561511249/photo/1
微软最近开源一个名叫 SkillOpt 的项目,通过训练让 Skill 自我迭代优化。 就像训练传统神经网络一样去训练 Agent 的技能,设定训练轮次、批大小和学习率。 最巧妙的是,整个进化过程完全不需要触碰或修改大模型的底层权重。 GitHub:https://t.co/DKK2oeNDtK… https://twitter.com/GitHub_Daily/status/2060511518652035202/photo/1
GitHub 上 Camelot 这个 Python 库,专门从 PDF 中提取表格,几行代码就能把表格变成可直接分析的数据。 内置五种解析模式,有边框线的表格、纯空格分隔的表格、甚至扫描件都能处理。 设置为自动模式后,它会自己判断该用哪种方式解析,不用手动选。 GitHub:https://t.co/iYUn7GpPDx… https://twitter.com/GitHub_Daily/status/2060352975349170206/photo/1
最近在 GitHub 上看到 Prompt-Engineering-Jumpstart 这本开源教程,专门教零小白写出稳定靠谱的提示词。 全书 14 章,不讲理论不写代码,提供修改前后的对比,把专家常用的 14 种核心提示词模式讲明白。 GitHub:https://t.co/xY0H24CmIo… https://twitter.com/GitHub_Daily/status/2060300125671723098/photo/1
平时给团队梳理业务逻辑,经常要同时打开画图软件和录屏工具来回切换,过程实在有些折腾。 于是找到 CanvasCast 这个开源工具,它把白板绘制、幻灯片演示和录制全整合到浏览器里。 打开网页就能画,支持画笔、图形、箭头、文字和图片,画完按幻灯片组织好,直接点录制,结束后导出视频文件。… https://twitter.com/GitHub_Daily/status/2060262393595433399/photo/1
想在网页端编辑 Word 文档,可能会选择在线办公套件(飞书),或转成其他格式再编辑。 偶然找到 docx-editor,直接在浏览器里编辑 docx 文件,所见即所得,改完导出还是 docx 格式。 所有操作都在客户端完成,文件不经过服务器,同时支持修订追踪和多人实时协作。 GitHub:https://t.co/XCKeIeZEMl… https://twitter.com/GitHub_Daily/status/2060232176210526623/photo/1
想在网页端编辑 Word 文档,可能会选择在线办公套件(飞书),或转成其他格式再编辑。 偶然找到 docx-editor,直接在浏览器里编辑 docx 文件,所见即所得,改完导出还是 docx 格式。 所有操作都在客户端完成,文件不经过服务器,同时支持修订追踪和多人实时协作。 GitHub:https://t.co/XCKeIeZEMl… https://twitter.com/GitHub_Daily/status/2060209565870985553/photo/1
想要转型 AI 开发或者准备系统设计面试,网上找到的大部分资料都是理论或者知识点已过时。 偶然看到 AI System Design Guide 这份在持续更新的系统性 AI 学习指南。 整理了 110 道面试真题和答题框架,涵盖 RAG 架构、Agent 智能体、多租户隔离以及大模型选型等核心技术栈。… https://twitter.com/GitHub_Daily/status/2060209546157773060/photo/1
平时看没有字幕的外语直播、公开课,或者开线上会议时,想要实时转录并做总结,颇为麻烦。 于是找到 DeLive 这个开源项目,直接捕获电脑系统音频进行实时转录,还自带一整套 AI 回顾工作台。 GitHub:https://github.com/XimilalaXiang/DeLive 接入了 12… https://twitter.com/GitHub_Daily/status/2059990584857911504/photo/1
给用 Obsidian 的朋友推荐一个开源插件:Obsidian Digital Garden,它能把 Obsidian 笔记变成一个好看的个人网站,而且只发布你主动标记的内容。 只需在笔记头部加一行标记,执行发布命令就能上线。没标记的笔记绝不会被泄露,隐私控制做得很到位。 GitHub:https://t.co/LWL3794JKk… https://twitter.com/GitHub_Daily/status/2059937737759977637/photo/1
GitHub 上 AgentHub 这个项目,给 Claude Code 组建了一支虚拟开发团队。 包含产品经理、技术主管、前后端开发等 46 个角色,就像管理真实公司一样给 AI 下指令。 内置几十种标准化工作流,配合质量门禁,确保每一步开发都严格按流程执行。 还有拦截机制,AI… https://twitter.com/GitHub_Daily/status/2059899991809016271/photo/1
在 GitHub 上发现 Claude Office Visualizer 这个项目,把 Claude Code 的运行状态变成了一个像素风格的办公室动画,挺有意思。 主 Agent 扮演老板角色坐镇办公室,子 Agent 作为员工被派出执行任务,工作状态、对话气泡、任务进度全都实时可视化呈现。 GitHub:https://github.com/paulrobello/claude-office 白板提供有… https://twitter.com/GitHub_Daily/status/2059869790383276213/photo/1
最近看到 Pentest Agent Suite 这个开源工具,一套专为 AI 编码工具打造的自动化漏洞挖掘框架。 内置了 50 个专注不同漏洞类型的智能体,覆盖 XSS、SQL 注入、IDOR 等 19 类常见漏洞。 配合丰富的命令行工具和两千多行实战载荷库,直接覆盖完整的渗透测试流程。 GitHub:https://t.co/KjvYQqjCVX… https://twitter.com/GitHub_Daily/status/2059847159730876609/photo/1
想在手机上下载视频,可用的工具只支持少数几个平台,而且还满屏广告,体验非常差。 于是找到 TubeAIO NextGen 这个开源视频下载工具,支持超过 1000 个网站,免费无广。 只需粘贴链接就能自动识别视频,选好画质直接下载,最高支持 4K,操作很简单。 GitHub:https://t.co/uqgDKpIySj… https://twitter.com/GitHub_Daily/status/2059628198602883164/photo/1
当想准备 AI 和机器学习方向的面试时,会发现网上的资料散落在各处,且大部分都偏理论知识。 可以看下 AI Interview Codex 这份合集,它把机器学习面试需要的内容整理成了一份完整的备战指南。 覆盖机器学习算法手写实现、大模型与生成式… https://twitter.com/GitHub_Daily/status/2059575352876577061/photo/1
偶然看到一款开源的全能型视频处理工具: pyVideoTrans,可一键完成视频从语音识别到翻译配音的全流程。 它把语音识别、字幕翻译、AI 配音、音视频合成串成一条自动化流水线,上传视频一键输出另一种语言的版本。 GitHub:https://t.co/JczjVBa4mn… https://twitter.com/GitHub_Daily/status/2059537604807368767/photo/1
做 3D 动画和物理模拟的朋友,经常会遇到布料穿模、碰撞解算慢的问题,反复调参十分折磨。 最近日本最大的时尚电商 ZOZO 开源了一个物理求解器:ppf-contact-solver,专门解决碰撞模拟中的穿透问题。 它能模拟布料、固体和绳索之间的接触碰撞,全程无穿透,极端场景下能处理超过 1.8… https://twitter.com/GitHub_Daily/status/2059521489909735922/video/1
脑子里经常冒出创业想法,但不知道值不值得花几个月去做,网上搜一圈也只能得到模棱两可的答案。 偶然看到 Startup Idea Validation Agent 这个项目,可以用 AI 帮你在十分钟内完成从想法到验证的全流程分析。… https://twitter.com/GitHub_Daily/status/2059424376941064319/photo/1
又看到了一个开源的 AI 换脸工具: VisoMaster Fusion,支持图片、视频和实时摄像头。 内置多种换脸模型可选,还带遮挡遮罩、面部修复、表情编辑等功能,GPU 加速处理速度也很快。 GitHub:https://github.com/VisoMasterFusion/VisoMaster-Fusion 支持给视频里不同的人分别指定换脸对象,还能通过相似度阈值自动匹配追踪。… https://twitter.com/GitHub_Daily/status/2059265843582964066/photo/1
学 AI 和机器学习,公式多、概念杂,每次忘了某个算法细节都要翻半天资料,效率很低。 GitHub 上 AI-ML-Cheatsheets 这个项目,整理了一套来自斯坦福的速查手册,涵盖 AI 和机器学习核心知识点。 包含人工智能、Transformer 与大语言模型、深度学习、机器学习、概率统计、线性代数与微积分六大方向。… https://twitter.com/GitHub_Daily/status/2059212995935551806/photo/1
想让 AI 帮我们自动操作浏览器,现有的方案还是较为复杂,而且动不动就卡住,体验挺糟糕的。 偶然看到 Web-Use 这个开源项目,是一个自主浏览器 Agent,能像真人一样操控网页完成各种任务。 通过 Chrome… https://twitter.com/GitHub_Daily/status/2059175230296478125/photo/1
写论文的时候,画模型架构图、做汇报 PPT、整理实验数据图表,每个环节都要切换不同工具,反复折腾格式,的确耗时间。 最近看到 Paper2Any 这个开源项目,直接把论文丢进去,就能一键生成各种学术素材。 上传论文 PDF、截图或文字,AI 自动提取内容并生成可编辑的模型架构图、技术路线图、PPT… https://twitter.com/GitHub_Daily/status/2059122373794931043/photo/1
又挖掘到一个实用的技能:Taste Skill,已经斩获了 19200+ GitHub Star。 装上它后,可以让 AI 生成的前端界面颇有高级感,无论是布局、字体还是动效和留白都有明显提升。 GitHub:https://t.co/6IOChlETrE… https://twitter.com/GitHub_Daily/status/2059061992791654556/photo/1
平时用各种 AI Agent,总感觉缺乏长时记忆,每次都要反复粘贴当前的工作上下文,沟通成本极高。 在 GitHub 上看到 OpenChronicle 这个项目,给 AI 智能体加上本地记忆能力,类似 OpenAI Chronicle 的开源替代方案。 它在后台监听你 Mac… https://twitter.com/GitHub_Daily/status/2058903429653958867/photo/1
想系统学习 AI,网上资源太多太杂,课程、书籍、论文散落各处,不知道从哪开始、按什么顺序学,容易迷失方向。 最近看到 ai-learning-roadmaps 这个项目,把从入门到进阶的 AI 学习资源整理成一套完整的路线图。 覆盖了机器学习、深度学习、大语言模型、计算机视觉、自然语言处理等主流方向。… https://twitter.com/GitHub_Daily/status/2058850575496949931/photo/1
平时刷抖音看到一些电影解说视频,自己想做得找素材、写脚本、配音再剪辑,实在耗时耗力直接被劝退。 偶然看到 narrator-ai-cli-skill 这个项目,让 AI Agent 学会做电影解说视频,全程自动化。 只需对着 AI 说一句「帮我做一个电影解说」,就会自动搜索影片、选模板、配音乐、生成脚本、合成视频。… https://twitter.com/GitHub_Daily/status/2058812822700872106/photo/1
想把网页内容喂给 AI,结果抓回来一堆导航栏、广告和乱码,上下文窗口浪费大半,AI 还读不明白。 于是找到 PullMD 这个开源项目,可以把任意网页内容提取转成干净的 Markdown 文件。 只需提供网页链接,自动识别页面类型,层层提取正文内容,遇到 JavaScript… https://twitter.com/GitHub_Daily/status/2058759972494934510/photo/1
又发现一个实用的开源技能合集:Garden Skills,可让 AI 变身前端设计专家。 帮我们输出带有高级设计感、排版规范的高质量 Web 页面布局。 还能把稿件一键转化为 16:9 的网页幻灯片,方便直接录制演示视频。 GitHub:https://github.com/ConardLi/garden-skills 甚至包含了本地知识库精准检索,以及专业的 AI… https://twitter.com/GitHub_Daily/status/2058699620453425242/photo/1
想在电脑上管理手机文件、回复短信,市面上的管理工具总是绕不开广告和付费弹窗。 最近找到 PlainApp 这个开源项目,把手机变成一个自托管的管理中心。 同一网络下用浏览器就能操作,数据全程不出局域网。 手机装好应用后,打开浏览器就能看到一个完整的管理面板,所有连接都经过加密处理。… https://twitter.com/GitHub_Daily/status/2058541037761757264/photo/1
最近看到 Huashu Design 这个开源 Skill,只需一句话,就能直接交付产品级的设计作品。 支持直接生成带真实交互的 iOS 界面,或是能导出 MP4 和 GIF 格式的动效视频。 甚至能把生成的网页幻灯片,直接转换为保留文本排版的可编辑 PPT 文件。 GitHub:https://github.com/alchaincyf/huashu-design 内置 20… https://twitter.com/GitHub_Daily/status/2058495743112184009/photo/1
在 GitHub 上刷到一个前端组件库:Animal-Island-UI,设计风格来源于动物森友会的游戏界面,圆润可爱,眼前一亮。 所有视觉元素、图标和动画都是作者独立设计实现的,安装后一行代码引入样式就能直接用,开箱即用。 GitHub:https://t.co/9BzBCtvrEn… https://twitter.com/GitHub_Daily/status/2058474101648629785/photo/1
想用 AI 生成几十秒甚至更长的连贯视频,速度慢、显存爆、画面还容易崩,的确头疼。 最近英伟达团队开源的 LongLive 2.0,专门解决长视频生成的速度和质量问题,最快能跑到每秒 45.7 帧。 支持多镜头生成,可以按不同提示词依次生成多个片段并自然衔接。 GitHub:https://t.co/bFgzkdrzFh… https://twitter.com/GitHub_Daily/status/2058450489839403137/photo/1
当 AI 遇到真正的安全事件时,缺少资深安全分析师的判断流程和系统性操作步骤。 最近在 GitHub 上看到 Anthropic Cybersecurity Skills 这个开源项目,专门给 AI 智能体补上网络安全的实战知识库。 收录了 754 个结构化安全技能,覆盖 26… https://twitter.com/GitHub_Daily/status/2058414217162895622/photo/1
又发现一个 Markdown 转 HTML 的开源工具:md2html,一键将 MD 转成精美的网页。 它不是简单的格式转换,而是让 AI 智能分析内容,自动把流程描述变成流程图,把优缺点对比变成卡片,把操作步骤变成时间线。 GitHub:https://t.co/nFHwr7jKAV… https://twitter.com/GitHub_Daily/status/2058178765889667164/photo/1
给用 Obsidian 的朋友分享一个实用插件:Apex Dashboard,把备忘、待办、项目管理全整合进一个仪表盘页面。 所有数据直接存在 Markdown 文件中,纯文本可读可编辑,不依赖额外数据库,打开就能用,不用在笔记之间来回切换。 GitHub:https://t.co/8d7hyYEywz… https://twitter.com/GitHub_Daily/status/2058159790703231134/photo/1
想画网络架构图,用专业工具得学半天,要在白板上拖来拖去,最后导出的效果还不一定满意。 于是找到 Netviz 这个开源项目,直接在浏览器里拖拽就能设计网络架构图,不用装任何软件。 把服务器、代理、数据库这些组件往画布上一拖,连线标注数据流向,还能按层级分组整理,整个过程很直观。… https://twitter.com/GitHub_Daily/status/2058141589378404799/photo/1
关注的博主、技术站点越来越多,想集中看看更新,发现大部分 RSS 阅读器太臃肿。 最近看到 Papr 这款开源桌面 RSS 阅读器,基于 Rust 和 Tauri 开发,本地优先、启动快。 所有数据存在本地数据库里,无需账号,不依赖云服务,打开就能用,订阅源和文章都在自己手里。… https://twitter.com/GitHub_Daily/status/2058088396783051042/photo/1
最近找到一个能一键清除 AI 图片上的各种水印和标记的开源工具: Remove-AI-Watermarks。 支持 Gemini、Midjourney 等平台生成的图片,可见水印和隐藏水印都能处理,包括谷歌的 SynthID。 GitHub:https://github.com/wiltodelta/remove-ai-watermarks 还能清除触发平台被打上「AI… https://twitter.com/GitHub_Daily/status/2058035204871319924/photo/1
刚接手一个新项目,面对几十万行代码,光是理清文件之间的调用关系和整体架构,就得花上好几天,效率很低。 于是找到 Understand Anything 这个开源项目,把整个代码库生成一张可交互的知识图谱,直观地看清每个模块之间的关系。… https://twitter.com/GitHub_Daily/status/2057816311066161265/photo/1
今天在 GitHub Trending 榜上看到 oh-my-pi 这个开源编码 Agent,把 IDE 的核心能力直接搬进了终端,挺有意思的。 内置 32 个工具,可对接编辑器的语言服务和调试器,重命名、跳转引用、断点调试这些操作,AI 自己就能完成,不用你手动切换。 GitHub:https://t.co/bgHtJfDoIi… https://twitter.com/GitHub_Daily/status/2057763442916983190/photo/1
最近 .NET 官方团队开源了一组 Skills,专门给编程智能体提供一套官方维护的技能插件合集。 让 AI 编程助手在处理构建诊断、包管理、版本升级、性能调试这些任务时,能给出更准确可靠的方案。 GitHub:https://github.com/dotnet/skills 目前有 12… https://twitter.com/GitHub_Daily/status/2057725664376340687/photo/1
想把电子书或文档转成有声书,市面上的工具要么音质太机械,要么不支持字幕同步,折腾半天效果还不理想。 偶然发现 Abogen 这个开源项目,能把 ePub、PDF、文本等文件快速转成高质量音频,还能自动生成同步字幕。 底层用的是 Kokoro 语音模型,音频合成效果自然。据实测 3000 字的文本,11… https://twitter.com/GitHub_Daily/status/2057672803600760870/video/1
用 AI 写的文章,读起来总有一股 AI 味,句式工整、用词重复,发布或提交后总担心被检测到。 最近偶然找到了 AI Humanize Text 这个开源工具,专门把 AI 生成的文本改写成更自然的人类写作风格。… https://twitter.com/GitHub_Daily/status/2057612448971268097/photo/1
准备系统设计面试,网上找到的资料基本都是零散的博客文章,真正成体系、有深度的免费教程很难找到。 偶然看到 HLD Handbook 这个开源项目,一整套高级系统设计教程,内容量相当惊人。 159 个教学章节加 22 个架构决策对比页,涵盖 719 张图解和 3100 多条学术引用,相当于一本 2200 页的教科书。… https://twitter.com/GitHub_Daily/status/2057453877767913558/photo/1
又发现一款实用的开源终端工具 Muxy,主打轻量低内存占用,同时塞进了不少实用功能。 按项目排列工作区,每个项目的标签页、分屏状态都能自动保存恢复,切换项目时无缝衔接。 GitHub:https://github.com/muxy-app/muxy 内置了 Git… https://twitter.com/GitHub_Daily/status/2057401043731034468/photo/1
计算机专业找实习,简历上没项目经验是最头疼的事。想从 GitHub 找个项目练手,又不知道选哪个、怎么跟岗位挂钩、面试时怎么讲。 偶然看到 SIT 这个开源工具,专门帮零经验的同学把一份岗位描述变成能写进简历、能在面试里讲清楚的项目经历。 只需要把目标岗位的招聘需求丢给它,就能自动推荐匹配的… https://twitter.com/GitHub_Daily/status/2057363278398115895/photo/1
想要系统学习 AI 开发,网上的资料又太碎片化,东一篇论文西一个教程,拼不成完整的知识体系。 最近找到 AI Engineering from Scratch 这份开源课程,共 435 节课、分 20 个阶段,从数学基础一路讲到自主智能体,体系相当完整。… https://twitter.com/GitHub_Daily/status/2057310450845700106/photo/1
电脑上偶尔想简单修个图、标注个截图,打开 Photoshop 太重,系统自带的画图工具又功能太少。 最近找到 Pinta 这个开源好用的图片编辑器,支持 Linux、Windows 和 macOS 系统。 界面风格简洁直观,上手几乎零门槛,但该有的图层、混合模式、特效滤镜一样不少。 GitHub:https://t.co/uNGzyFnTcp… https://twitter.com/GitHub_Daily/status/2057250030864748913/photo/1
用 Claude Code 或 Codex 写代码,开多个窗口来回切换,不仅看着乱,管理各种对话和上下文也挺费劲。 最近发现了 Kooky 这个开源终端,专门为 AI 编程场景设计,把多个智能体的管理做得很顺手。 内置了 Claude Code、Codex、Gemini CLI 等七种主流 AI… https://twitter.com/GitHub_Daily/status/2057091493102571867/photo/1
现在越来越觉得,Claude Code 或 Codex 最大的问题,已经不是写不出代码。 而是它记不住,我们对话中聊过的方案、踩过的坑,以及项目开发进度等等信息。 偶然发现 EverOS 开源了一个 Claude Code 插件,给 AI 装上了能自我进化的长期记忆。 GitHub:https://t.co/UzZZPsbpw4… https://twitter.com/GitHub_Daily/status/2057044028693316016/photo/1
想把常用的网站变成手机 App,以往得搭开发环境,或者依赖在线打包服务,门槛并不低。 最近看到 WebToApp 这个开源项目,直接在手机上就能把网站打包成安装包,全程不需要电脑和服务器。 只需输入一个网址,选好配置,一键生成签名好的安装包,整个构建过程完全在本地完成。… https://twitter.com/GitHub_Daily/status/2057023559856480538/photo/1
各大 AI 厂商都会有一些免费额度可用,但单独拿出来看,每天的请求量根本不够塞牙缝。 想要把这些免费额度全凑到一齐使用,又要面对十几套不同的 SDK 和复杂的接口限制。 最近就有位开发者做了这件事,并将 FreeLLMAPI 这个项目开源了。 GitHub:https://t.co/yidaFxoF43… https://twitter.com/GitHub_Daily/status/2057000902830276836/photo/1
想在 iPhone 上安装一些 App Store 之外的应用,过去常用的工具大多只支持 Mac 或 Windows,Linux 用户基本被排除在外。 最近发现了 Impactor 这款开源工具,能帮我们把 ipa 安装包直接装到 iPhone 上,同时支持 macOS、Linux 和 Windows 三端。 用自己的 Apple ID… https://twitter.com/GitHub_Daily/status/2056729102170886348/photo/1
用 AI 给视频配音或者克隆一段语音,要么得按月付费用云端服务,要么数据还得传到别人服务器上,隐私和成本都让人纠结。 最近找到了 OmniVoice Studio 这个开源版的 ElevenLabs,语音克隆、视频配音全部在本地跑,不需要任何 API 密钥。 只要一段 3 秒的音频就能克隆任意声音,支持 646… https://twitter.com/GitHub_Daily/status/2056676252581511234/photo/1
搞量化交易或者技术分析,光是实现各种指标就够折腾的,还得自己搭回测框架验证策略,既耗时又容易出错。 最近看到 Indicator 这个 Go 语言的技术分析库,内置 80 多个指标和几十种现成策略,还自带回测框架,相当完整。… https://twitter.com/GitHub_Daily/status/2056638536724718064/photo/1
卧槽,吉卜力工作室多年使用的动画制作工具,原来早已开源! 像《千与千寻》、《龙猫》和《幽灵公主》这些知名的动画,均使用到 Toonz 这款工具制作。 内置了吉卜力专属的线稿扫描工具,能高效将手绘原画转化为数字资产。 GitHub:https://t.co/0Ir64LnMFZ… https://twitter.com/GitHub_Daily/status/2056585675689107662/photo/1
想搭一套本地 AI 环境挺折腾的,配驱动、写配置、调端口,弄半天可能还跑不起来。 最近找到 Dream Server 这个开源项目,只需一条命令,就能在自己电脑上搭起一整套本地 AI 服务,不依赖任何云平台。… https://twitter.com/GitHub_Daily/status/2056525272674144664/photo/1
周末想安静看个电影或追个剧,满屏广告弹窗,好不容易找到资源还卡到飞起,心情极其复杂。 于是到 GitHub 找到 Streambert 这个开源桌面应用,可以直接观看和下载全球的电影、剧集和动漫,完全没有广告和追踪。… https://twitter.com/GitHub_Daily/status/2056366751450042766/photo/1
商汤最近开源了一款专用于信息图生成的 AI 模型,效果特别惊艳。 可一键生成海报、图表、食谱卡片、明信片,甚至是 arXiv 风格的页面。 官方放出了 100 多个生成案例及提示词,涵盖各种风格的信息图,可以直接参考学习。 GitHub:https://github.com/OpenSenseNova/SenseNova-U1 模型下载:https://t.co/b1XBXuqHa3… https://twitter.com/GitHub_Daily/status/2056315091507974354/photo/1
偶然看到 Open Generative AI 这个开源项目,整合了 200 多个主流图像和视频生成 AI 模型,没有内容审查限制。 提供图片、视频、口型同步、电影级镜头四个工作台,文生图、图生视频、音频驱动口型动画都能搞定,界面统一操作简单。 GitHub:https://t.co/P0jc71euXL… https://twitter.com/GitHub_Daily/status/2056276133369573489/photo/1
在 GitHub 上发现 Fli 这个项目,通过逆向 Google Flights 的接口,直接用命令行或在 AI 上就能查询航班信息,不依赖网页抓取,速度快且稳定。 一条命令就能搜航班、比价格、筛直飞,还能查指定日期范围内的最低价,像个终端里的机票搜索引擎。 GitHub:https://github.com/punitarani/fli 提供 MCP,可配置到… https://twitter.com/GitHub_Daily/status/2056223265627291870/photo/1
想把手绘草图或参考图片转换成 3D CAD 模型,用传统建模软件得手动一步步画,费时费力。 这两天在 GitHub 发现 GenCAD 这个开源项目,能根据输入的图像直接生成对应的 CAD 模型。 能够很好地还原图像中的几何特征,并输出标准模型文件,还附带了 STL 转 PNG… https://twitter.com/GitHub_Daily/status/2056185519365816338/photo/1
在 Linux 上想调整显卡的风扇转速、功耗或者超频,要么靠命令行手动改参数,要么用的工具只支持某一家显卡,折腾起来挺费劲。 最近找到 LACT 这个开源项目,提供了一个图形界面,能直接管理 AMD、Nvidia 和 Intel 三家显卡的各项设置。… https://twitter.com/GitHub_Daily/status/2056004329119863021/photo/1
偶然看到 Clawd on Desk 这个开源的桌面宠物,能实时反映你的 AI 编程工具当前状态,挺有意思。 它会根据 AI 工具的实际动作切换动画,比如思考时冒泡、执行时打字、多任务时抛球杂耍、完成时庆祝,一眼就知道进度。 GitHub:https://github.com/rullerzhou-afk/clawd-on-desk 兼容 Claude… https://twitter.com/GitHub_Daily/status/2055951466356257012/video/1
日常工作中重复性任务太多,想用自动化工具提效,但市面上工具五花八门,不知道该选哪个。 最近看到 Awesome Workflow Automation 这份资源合集,把工作流自动化领域的工具、框架、文章、课程整理得非常全面。 不只是简单罗列工具名称,而是按场景分类:传统自动化平台、AI… https://twitter.com/GitHub_Daily/status/2055913742496632866/photo/1
GitHub 上 Plausible Analytics 这个开源项目,主打隐私优先的轻量网站统计,可作为 Google Analytics 不错的替代方案。 不用 Cookie,不采集个人信息,所有关键数据都在一个页面上展示,打开就能看,不需要学习成本。 GitHub:https://t.co/zXDAVZHouN… https://twitter.com/GitHub_Daily/status/2055860890696921221/photo/1
系统上跑着一堆进程,用各种工具轮番查,都搞不清楚它们的源头是什么程序在跑。 最近一款名叫 witr 的开源工具爆火,一行命令,就能把进程的整条链路搞清楚。 只需要给它一个进程名、端口号或 PID,它就会告诉我们这个进程是谁启动的、怎么起来的、被什么系统管着。… https://twitter.com/GitHub_Daily/status/2055800495680467430/photo/1
用 AI 辅助写学术论文,规划思路和实际写作往往是脱节的。想法有了,但从文献梳理到成稿投递,中间环节太多,容易写着写着就跑偏。 最近找到 academic-paper-skills 这个开源的学术论文写作技能,把从选题到定稿的全流程都系统化了。… https://twitter.com/GitHub_Daily/status/2055641988968628485/photo/1
管理服务器时,SSH 终端、数据库客户端、Redis 管理器来回切换,光是找窗口就够烦的了。 最近发现 OpsKat 这个开源桌面工具,把服务器管理和 AI 结合到了一起,用自然语言描述需求,它自动帮你执行操作。 GitHub:https://github.com/opskat/opskat 安全方面做得挺好,所有操作都有策略管控和审计日志,SQL… https://twitter.com/GitHub_Daily/status/2055589102951792715/photo/1
平时向 AI 询问数学或理科问题时,公式推导、函数图像、几何关系,光靠文字描述很难理解。 最近看到 ChatTutor 这个项目,给 AI 装上了电子白板,让它像真正的老师一样边讲边画。 内置了数学画布功能,AI 可以直接绘制函数图像、几何图形,还能生成思维导图来梳理知识脉络,交互感很强。… https://twitter.com/GitHub_Daily/status/2055551339426717932/photo/1
用 Claude Code 写前端完全没问题,但生成的页面总是千篇一律,看着就是一股 AI 味。 偶然看到 Claude Code Frontend Design Toolkit 这个项目,整理了能让 Claude Code 输出更好看前端界面的工具合集。 按使用场景分成了十个板块,从设计风格、主题配色、动效动画到 Figma… https://twitter.com/GitHub_Daily/status/2055498503355515043/photo/1
处理大量视频数据时,想快速找到某个片段、生成摘要,靠人工一帧帧看根本不现实。 最近 NVIDIA 开源 Video Search and Summarization 项目,用自然语言就能对视频进行搜索、问答和摘要生成。 它把视觉语言模型和大语言模型结合起来,对实时视频流或存量视频做智能分析,支持多种 Agent 工作流。… https://twitter.com/GitHub_Daily/status/2055472424263815311/photo/1
又发现了一个好用的 Skill,一句话就能把任何内容转成播客、PPT、思维导图等格式。 支持超 15 种内容源,包括公众号、小宇宙播客、YouTube 视频、PDF、电子书等。 还能自动识别并尝试绕过付费墙,覆盖纽约时报、华尔街日报等 300 多个站点。 GitHub:https://github.com/joeseesun/qiaomu-anything-to-notebooklm 可以安装到 Claude… https://twitter.com/GitHub_Daily/status/2055279582501392840/photo/1
自从发现 PinMe 这个开源的网站部署神器后,便一直用它来部署静态的前端小项目。 刚刚,打开PinMe项目地址想确认下命令时,发现它的官网首屏标题换成了:「一条命令,搭起你的 Web 应用」。 GitHub:https://github.com/glitternetwork/pinme 发现有重大更新,现在 PinMe 不再只是部署工具,而是能帮我们实现全栈的… https://twitter.com/GitHub_Daily/status/2055226683418869797/photo/1
飞书前不久开源的命令行工具 lark-cli,可让 AI Agent 在终端中直接操作飞书。 刚发现,已斩获 10000+ Star,成为国内办公套件里第一个突破万星的开源 CLI 工具。 飞书确实做得挺开放的,像消息、文档、多维表格、会议这些核心业务,都下放了操作权限给 CLI 调用。… https://twitter.com/GitHub_Daily/status/2055149550785134739/photo/1
大家都在说 AI 能替代人力,但真要用 AI 平替一家公司的全部岗位,从哪下手、怎么编排,相信大多数人其实都没概念。 最近看到 Headcount Zero 这本开源书籍,为我们讲怎么用 AI 智能体搭建一家「零员工」公司,思路挺有意思的。 核心方案是一个创始人加一整张由 AI… https://twitter.com/GitHub_Daily/status/2055081837098340799/photo/1
用 Claude Code 开发项目,代码库一大,每次探索代码结构都要扫一堆文件,工具调用多、速度慢,token 也跟着烧。 于是找到 CodeGraph 这个开源工具,给代码库预建一张语义知识图谱,让 Claude Code 直接查图而不是逐文件扫描。 效果颇为明显,工具调用减少 92%,探索速度提升 71%,像 VS Code… https://twitter.com/GitHub_Daily/status/2054917184158318628/photo/1
GitHub 上 Symbiotic AI 这个项目,仅用几个简单的文本文件,就能让 AI 跨会话记住你的背景、习惯和当前进度。 核心四个文件,一个定义 AI 人格,一个记录你的特点,一个设定协作规则,一个追踪当前任务。AI 每次启动时读取这些文件,越用越懂你。 GitHub:https://t.co/SPZok0jhrV… https://twitter.com/GitHub_Daily/status/2054864316646797431/photo/1
偶然看到 AI Data Extraction Toolkit 这个开源项目,可以用来一键提取各个 AI 编程助手的完整对话记录。 支持 Claude Code、Cursor、Codex、Windsurf、Gemini CLI 等八款主流工具,自动识别系统和安装路径,直接输出统一的 JSONL 格式。 GitHub:https://t.co/MexLXyxcNW… https://twitter.com/GitHub_Daily/status/2054826598130761969/photo/1
写论文用 LaTeX 排版,经常要在编辑器和 AI 之间来回复制粘贴,遇到宏包冲突更是让人头疼。 最近找到 LMMs-Lab Writer 这个开源 LaTeX 编辑器,主打本地优先、AI 原生,试了下体验不错。 内置 AI 面板,直接对话就能让 AI 帮你写段落、改内容,修改实时同步到编辑器里,支持接入各种主流大模型。… https://twitter.com/GitHub_Daily/status/2054773716157149617/photo/1
写论文用 LaTeX 排版,经常要在编辑器和 AI 之间来回复制粘贴,遇到宏包冲突更是让人头疼。 最近找到 LMMs-Lab Writer 这个开源 LaTeX 编辑器,主打本地优先、AI 原生,试了下体验不错。 内置 AI 面板,直接对话就能让 AI 帮你写段落、改内容,修改实时同步到编辑器里,支持接入各种主流大模型。… https://twitter.com/GitHub_Daily/status/2054713328107409781/photo/1
做量化交易策略,回测和实盘往往是两套代码,换个券商又得重新对接,折腾半天还没开始交易。 在 GitHub 上看到 Lumibot 这个开源量化交易框架,同一套策略代码既能回测也能直接接入真实券商下单,省去了重复开发的麻烦。 内置原生 AI… https://twitter.com/GitHub_Daily/status/2054554777091235937/photo/1
用 AI 写前端界面,生成风格千篇一律。想要毛玻璃效果、想要极简风,每次都得在提示词里反复描述,确实费劲。 偶然刷到 Awesome Design Skills 这个合集,提供了 67 套现成的设计系统技能文件。 风格覆盖面很广,从毛玻璃、新拟态、像素复古到企业级、编辑排版风格都有。… https://twitter.com/GitHub_Daily/status/2054501930525925837/photo/1
MMD 动画编辑工具基本只有 Windows 版本,想在 Mac 或平板上随时调动作颇为费劲。 最近看到 Reze Studio 这个项目,能在浏览器里就能编辑 MMD 动画,跨平台无需安装,开箱即用。 基于WebGPU渲染,帧率流畅,从 iPad 到笔记本都能用,打开网页就是一个专业的时间轴和曲线编辑器。… https://twitter.com/GitHub_Daily/status/2054464189905993823/photo/1
GitHub 上 Yao Open Prompts 这个开源提示词库,按真实场景分好类,直接复制就能用,颇为全面。 包含了 116 个中文提示词,覆盖工作、学习、营销、内容创作、编程等九大类,每个文件只保留可复制的提示词正文,干净利落。 GitHub:https://t.co/JOn1hd3Ilr… https://twitter.com/GitHub_Daily/status/2054411325582065953/photo/1
让 AI Agent 访问多个外部服务,要对接不同的 SDK 和 API,还是不同的调用逻辑,维护起来很头疼。 最近看到 Mirage 这个项目,挺有意思的。它把所有外部服务统一套在一个虚拟文件系统,让 AI 智能体用命令就能操作所有数据源。 就是说,把 S3、Google Drive、Slack、GitHub、Redis… https://twitter.com/GitHub_Daily/status/2054350928845873203/photo/1
每天都诞生各种各样 AI 智能体,想要快速找到适合特定业务场景的工具和框架,确实有些费时费力。 GitHub 上的 awesome-ai-agents-2026 开源项目,正好整理了一份详细的当下主流 AI 智能体工具。 收录了 340 多个项目,涵盖代码编写、语音交互、创意生成、工作流自动化等 20 多个细分领域。… https://twitter.com/GitHub_Daily/status/2054192420884189597/photo/1
最近看到,一个连马斯克都转发点赞过的开源项目:PraisonAI。 仅需 5 行代码,就能部署一组自主协作的 AI 智能体,从单个到整支可 24 小时自主运行的 Agent 团队。 支持 100 多个大语言模型,内置规划、记忆、自我反思等能力,智能体之间可以自动交接任务、互相纠错。… https://twitter.com/GitHub_Daily/status/2054151716690620879/photo/1
用 GPT Image 2 生成图片,每次从零开始写、或复制粘贴提示词,想要特定风格却不知道怎么描述,反复试错挺浪费时间。 在 GitHub 上看到 GPT Image 2 Skill 这个项目,提供了一整套精选的图片生成提示词库,还能作为 Claude Code 和 Codex 的技能直接调用。… https://twitter.com/GitHub_Daily/status/2054101793916031348/photo/1
在终端里查看 Markdown 文件,直接输出一堆原始标记,想快速预览一下内容不太方便。 于是找到 leaf 这个开源工具,直接在终端里渲染 Markdown,预览效果接近编辑器。 支持实时预览模式,文件保存后自动刷新,还能接收其他命令的输出,比如让 AI 生成的内容直接渲染展示。… https://twitter.com/GitHub_Daily/status/2054071632642388280/photo/1
今天在 Trending 榜上看到 OpenHuman 这个开源的个人 AI Agent,挺有意思的。 开箱即用,可连接我们的账号,几分钟就能建立起对我们的完整认知,不需要像以前 OpenClaw 那样养小龙虾。 主要是它会自动每 20 分钟从连接的 Gmail、Notion、GitHub、Slack 等 118… https://twitter.com/GitHub_Daily/status/2054049029701726621/photo/1
最近在 GitHub 上刷到 agentmemory 这个开源项目,给各类 AI 编程助手打造了持久化记忆引擎。 它能够在后台静默记录代码修改和上下文,自动提取并压缩成结构化记忆。 在下次新建会话时,无需重新解释,AI 就能直接调用之前的技术栈细节和开发习惯。 GitHub:https://t.co/KHIW0Jh4Hd… https://twitter.com/GitHub_Daily/status/2053829999007039754/photo/1
最近一个名为 9router 的开源工具火了,给所有 AI 编程工具加了一个智能调度中心。 像平时用 Claude Code 写代码,API 额度消耗极快,遇到大段报错日志更是瞬间把 Token 烧光。 而 9router 则内置了智能压缩算法,自动精简终端日志或代码差异中的冗余信息,每次请求能帮我们省下不少 Token 消耗。… https://twitter.com/GitHub_Daily/status/2053777161702781305/photo/1
平时用各种 AI 编程助手,多开几个会话电脑内存就容易狂飙,敲代码的反应也跟着变慢。 今天发现 jcode 这个开源项目,定位是主打高性能的下一代 AI 编程智能体。 用 Rust 语言重构了底层架构,内存占用和响应速度比主流同类工具快了好几倍。… https://twitter.com/GitHub_Daily/status/2053739402950742167/photo/1
GitHub 上 SpineDigest 这个开源工具,能把整本书提炼成结构化的精华内容,而且可以按自己的阅读目的来决定保留什么。 它的处理思路挺有意思的,先让 AI 逐章提取关键知识点,再用算法构建知识图谱把相关概念串联起来。 最后通过多个 AI 角色「答辩式」对抗生成最终摘要,确保不会遗漏重要内容。… https://twitter.com/GitHub_Daily/status/2053709202791735378/photo/1
想了解大语言模型到底是怎么工作的,找到的资料都太过于学术看不懂,或者说的太浅只讲概念,就没一个从头到尾讲清楚的内容。 无独有偶,看到 how-llms-work 这个项目,把大模型的完整流程做成了一个可视化交互网页,内容基于 Karpathy 的经典讲座整理。… https://twitter.com/GitHub_Daily/status/2053686553541767441/photo/1
Type-C 线长得都一样,但能力天差地别,哪根能跑满速,哪根只能慢充,完全分不清。 于是找到 WhatCable 这个开源小工具,插上线后会用大白话告诉我们这根线到底能干什么。 它直接读取系统底层的端口信息,把线缆的真实速率、充电功率、连接设备都翻译成人话展示出来,不用翻任何设置。… https://twitter.com/GitHub_Daily/status/2053467649091441064/photo/1
用 AI 写代码越来越顺手,但有些些术语真让人头大。上下文窗口、注意力退化、幻觉等,每个词都似懂非懂,出了问题也不知道从哪下手排查。 最近看到一份开源的 AI Coding Dictionary (AI 编程词典),用大白话把 AI 编程里的核心概念讲明白了。… https://twitter.com/GitHub_Daily/status/2053414769655435718/photo/1
独立开发者在国内做软件开发,申请软件著作权几乎是必做的工作之一。 但准备材料环节真的折腾,要申请表字段、操作手册、代码截取,格式和信息还得前后一致。 偶然看到 SoftwareCopyright-Skill 这个开源技能,可以帮我们在项目中一键生成整套软著申请资料。… https://twitter.com/GitHub_Daily/status/2053377018990153849/photo/1
想用代码处理 Office 文档,以前要写几十行代码调不同的库,折腾半天还不一定跑得通。 最近看到一个专门为 Agent 设计的 Office 命令行工具:OfficeCLI,轻松处理 Word、Excel、PowerPoint 的创建和编辑。 不需要安装 Office,不需要任何依赖,一条命令就能完成以前几十行代码才能干的事。… https://twitter.com/GitHub_Daily/status/2053324167811109367/photo/1
台式机没有配置麦克风,临时需要语音开黑或者线上开会,特意去买一个总觉得有些浪费。 最近找到 MicYou 这个开源工具,能把 Android 老旧手机变成电脑的高质量麦克风。 支持 Wi-Fi 和 USB 两种连接方式,内置降噪、自动增益和去混响功能,保证收音纯净。 GitHub:https://t.co/bZPCPf0gfx… https://twitter.com/GitHub_Daily/status/2053263810723819754/photo/1
最近看到 LTX Video Mac 这个项目,专门为 Apple Silicon 打造的原生 AI 视频生成应用。 用 SwiftUI 写的原生界面,底层跑的是苹果自家的 MLX 框架,输入一段文字描述就能生成带同步音频的视频片段,完全本地运行。 GitHub:https://t.co/ezCTyGgFFY… https://twitter.com/GitHub_Daily/status/2053105253361566002/photo/1
GitHub 上一款专为 Mac 打造的纯本地语音转文字开源工具:MacParakeet,识别准确率颇高。 支持直接拖拽音视频文件,或者贴个 YouTube 链接,就能快速输出带时间戳和说话人标签的文稿。 还能同时录制电脑系统声音和麦克风,开会时一边看实时转写,一边做笔记。 GitHub:https://t.co/8kuf3XIgrq… https://twitter.com/GitHub_Daily/status/2053052389868151213/photo/1
平时用 AI 生成网页或原型图,出来的效果往往充满廉价感,排版混乱且缺乏设计逻辑。 最近看到 cc-design 这个开源项目,专门让 AI 编程工具输出高保真的 HTML 设计作品。 装好后只需一句话描述需求,它会先出方案让你确认,再逐步构建,最终截图验证交付,整个流程像跟设计师协作的感觉。… https://twitter.com/GitHub_Daily/status/2053014638380597557/photo/1
想要在云端开发和部署企业级 AI Agent,往往需要啃一堆复杂的云服务文档,配置各种繁琐的运行环境。 于是谷歌开源了 agents-cli 工具,巧妙地把这些工程化知识,打包成了 AI 编程助手专属的“技能包”。 无缝接入 Claude Code、Gemini CLI、Codex 等主流编程 Agent 工具,让 AI… https://twitter.com/GitHub_Daily/status/2052961795263074404/photo/1
做爬虫或跑自动化脚本时,总会被各种反爬验证拦截,用常规的隐藏插件依然防不胜防。 今天看到 CloakBrowser 这个开源项目,直接在 C++ 源码层面修改了 Chromium 的指纹特征。 并非简单的 JS 注入或配置修改,而是从底层重构了画布、音频、硬件报告等核心信号。… https://twitter.com/GitHub_Daily/status/2052901392864760081/photo/1
有时候会打开多个 Claude Code、Codex 会话窗口,同时执行不同开发任务,无法及时查看运行状态。 最近找到 Open Island 这个开源工具,专门用来监控和管理多个 Agent 的运行状态。 利用 Mac 的刘海屏区域,实时显示各个 Agent 会话的运行状态。… https://twitter.com/GitHub_Daily/status/2052742864136995096/photo/1
用电脑写东西的时候,脑子里想法很清楚,但打字组织语言就是慢。 尤其写 AI 提示词,说起来一句话的事,打出来还得反复调整格式。 在 GitHub 上看到 OpenLess 这个开源语音输入工具,可作为 Typeless、Wispr Flow 这些产品的开源平替 。… https://twitter.com/GitHub_Daily/status/2052689985707606286/photo/1
又看到一个颇为好用的开源 Skill:Ian Handdrawn PPT,把文章、课程笔记、提纲变成中文手绘风格的技术解释图。 风格是近白纸底、细线条铅笔排线,配淡蓝淡绿等柔和标记色,中央图小而精,留白很多,文字克制。 GitHub:https://github.com/helloianneo/ian-handdrawn-ppt 支持 21:9 封面图和 16:9… https://twitter.com/GitHub_Daily/status/2052652282504974420/photo/1
刚看到一个开源桌面应用 Modly,开箱即用一键将任意图片转成 3D 模型,所有计算都在本地 GPU 完成。 只需导入一张照片,选择模型,点击生成,就能得到一个 3D 网格模型。 全程离线运行,不上传任何数据到云端,无需任何费用。 GitHub:https://github.com/lightningpixel/modly 还可以自由切换模型,支持一键安装… https://twitter.com/GitHub_Daily/status/2052599388468650066/photo/1
想简单剪辑一条视频,打开剪映这些大软件,配置稍低电脑卡得飞起,部分功能还收会员。 最近找到一个开源平替:OpenReel Video,在浏览器里运行的视频编辑器,打开网页就能用。 功能还相当多,涵盖多轨道剪辑、关键帧动画、调色面板、音频混音和降噪、绿幕抠像等。 甚至还有 20… https://twitter.com/GitHub_Daily/status/2052538992235794434/photo/1
做计算化学研究,想用机器学习方法但不知道该选哪个工具、哪个数据集,相关项目散落在各处,找起来费劲。 GitHub 上 Best of Atomistic Machine Learning 这份精选合集,系统梳理了原子级机器学习领域的开源项目,已收录超 510 个项目。 所有项目按质量评分自动排名,涵盖 23… https://twitter.com/GitHub_Daily/status/2052380830019080227/photo/1
不少朋友在 Mac 电脑上跑本地大模型,发现速度慢、内存吃紧,体验大打折扣。 其实问题并不在硬件,Apple Silicon 芯片的算力一直在,只是没被充分释放出来。 最近一个名叫 Cider 的项目悄然开源,专为 Apple Silicon 设计的本地推理加速框架。 把 Mac… https://twitter.com/GitHub_Daily/status/2052327598282441116/photo/1
五一假期在家想做饭,发现以前收藏菜谱散落在各种 App、或短视频里,翻找了半天。 无独有偶,找到一个开源的食谱管理工具: Mealie,把所有食谱集中管理起来。 只需直接粘贴菜谱网页链接,它就会自动抓取食材、步骤等信息,省去手动录入的麻烦。 GitHub:https://t.co/4TMzk5uPNh… https://twitter.com/GitHub_Daily/status/2052289877522444336/photo/1
用 Claude 辅助编程或分析问题,当把视频或录屏发给它,却发现它无法直接进行分析。 于是找到 claude-video-vision 这个插件,给 Claude Code 装上「眼睛和耳朵」,让它能看懂视频。 原理很粗暴:用 ffmpeg 抽取视频帧作为图片,同时通过音频后端生成带时间戳的文字转录,两者一起交给 Claude 理解。… https://twitter.com/GitHub_Daily/status/2052236998883307617/photo/1
找工作时,每天在各大招聘平台和公司官网之间来回跳转,效率颇低。 偶然看到 OpenPostings 这个项目,把 50 多个主流招聘系统的职位聚合到一起,每天自动抓取超过 50 万条新岗位。 覆盖了 78000 多家公司,只保留 24 小时内发布的新职位,过期自动清理,保持更新。 GitHub:https://t.co/PZK3UY9Mxv… https://twitter.com/GitHub_Daily/status/2052176603179081857/photo/1
做表格类数据预测的时候,传统机器学习模型经常要花大量时间调参、做特征工程,对小数据集还容易过拟合。 最近发现 TabPFN 这个项目,一个专门针对表格数据做分类和回归任务的基础模型,小数据集上的表现相当惊艳。… https://twitter.com/GitHub_Daily/status/2052018111143145483/photo/1
Claude Code 用着用着偶尔会卡住,光标一直在转,不知道它在想什么还是已经罢工了,让人光着急。 在 GitHub 上刷到一个颇有趣的开源小工具: OpenWhip,用一根鞭子来鞭策你的 Claude Code。 点击菜单栏图标会生成一根鞭子,对着 Cluade Code… https://twitter.com/GitHub_Daily/status/2051965209129169291/photo/1
批量处理图片,要转格式、改尺寸、重命名,一张张操作太费时间,找个好用的批量工具又不容易。 偶然看到 Converseen 这个开源的批量图片处理工具,支持超过 100 种图片格式互转,操作很简单。 选好文件,设置好输出格式和尺寸,点一下就能批量完成转换、缩放、旋转等操作,不用逐张处理。… https://twitter.com/GitHub_Daily/status/2051927473559130268/photo/1
平时让大模型写需求文档或者做产品规划,生成的回复往往比较空泛,缺乏真实的商业落地视角。 GitHub 上 lenny-skills 这个开源的技能,给 Claude Code 注入资深产品经理的思维。 提炼了上百期知名商业播客的内容,将一线专家的实战经验,转化成了 86 个专属技能文件。… https://twitter.com/GitHub_Daily/status/2051878537523814738/photo/1
搞数据抓取或是管理多个账号时,现在的网站指纹检测越来越严,普通的隐身模式根本不够用,账号动不动就被关联封禁。 最近看到 undetectable-fingerprint-browser 这个开源项目,是一款可编程的反检测浏览器,指纹伪装做得相当全面。 它能同时伪装… https://twitter.com/GitHub_Daily/status/2051814232514289852/photo/1
用 AI 生成出来的前端界面,要么千篇一律,要么细节粗糙,做不出真正能打的设计。 GitHub 上 Awesome AI Tools for UI 这份精选合集,专门收录帮 AI 提升界面审美和设计水准的工具。 GitHub:https://github.com/maxbogo/awesome-ai-tools-for-ui 目前共收录 26 个工具,分成 Skills、Apps、MCP Servers、Design… https://twitter.com/GitHub_Daily/status/2051655710128357561/photo/1
做内容自媒体一般都会管理多个平台账号,常常被 SaaS 按席位或账号收费搞得心累。 最近发现 BrightBean Studio 这个开源项目,自托管的社媒管理平台。 对标 Sendible、SocialPilot 等付费工具,没有账号数、席位数和工作区限制。 GitHub:https://github.com/brightbeanxyz/brightbean-studio 支持… https://twitter.com/GitHub_Daily/status/2051602881229549943/photo/1
平时用 Claude Code 处理事情,每次开新会话都得重新解释一遍背景,Obsidian 里堆了几百个笔记,也只是静静躺着,两边完全没打通。 最近在 GitHub 发现 obsidian-second-brain 这个项目,把 Obsidian 仓库变成一个会自我重写的 AI 第二大脑,作为 Claude Code 的 Skill 来使用。 灵感来自 Karpathy… https://twitter.com/GitHub_Daily/status/2051565075614589385/photo/1
让 AI 写研究报告或整理资料,输出的排版总是干巴巴的默认样式,看着毫无阅读欲望。 偶然看到 Kami 这个项目,给 AI 加了一套文档设计系统,生成的文档像精心排版过的印刷品了。 名字取自日语「紙」,核心思路是用一套约束规则管住 AI 的排版,暖色羊皮纸底色搭配墨蓝色调,出来的页面干净又有质感。… https://twitter.com/GitHub_Daily/status/2051517304543105279/photo/1
下载 BT 种子,不少朋友用的客户端,界面臃肿不说,还带大量广告,更离谱的还有偷偷捆绑安装软件。 最近找到 qBittorrent 这个开源 BT 下载工具,干净无广告,功能齐全,用着很省心。 界面风格和经典 BT 客户端类似,上手没什么门槛,下载速度稳定,对中文和各种特殊字符支持也很好。… https://twitter.com/GitHub_Daily/status/2051451837442887882/photo/1
团队协作开发时,API 密钥、数据库密码这些敏感配置散落在各处,有人放环境变量,有人写在配置文件里,稍不注意就泄露到代码仓库中。 在 GitHub 上看到 Infisical 这个开源密钥管理平台,把所有敏感配置集中管理,还能自动同步到各个服务和环境。… https://twitter.com/GitHub_Daily/status/2051293303879151652/photo/1
路由器自带的厂商固件,有很多设置改不了,想装个插件或折腾进阶网络玩法,遇到各种限制。 偶然看到 OpenWrt 这个老牌开源路由器操作系统,专门给嵌入式设备用的 Linux 系统,把路由器变成一台真正可控的小电脑。… https://twitter.com/GitHub_Daily/status/2051240446094147986/photo/1
GitHub 上 DeepSeek TUI 这个项目,把 DeepSeek V4 搬进终端,做成一个完整的编码智能体。 仅一个二进制文件,能直接读写文件、执行命令、搜索网页、管理 Git,还能实时看到模型的思考过程。 GitHub:https://github.com/Hmbown/DeepSeek-TUI 提供三种工作模式:Plan 模式只读探索不动代码,Agent… https://twitter.com/GitHub_Daily/status/2051202697215549687/photo/1
每次 App 上架或者更新,制作应用商店的宣传截图都是个体力活,排版、调背景要折腾半天。 最近找到 Snapframe 这个开源截图美化工具,在浏览器里就能生成专业级的应用商店展示图。 内置多种设备模板,拖入截图后自动套上手机外框,再配上标题文字和主题配色,实时预览所见即所得。… https://twitter.com/GitHub_Daily/status/2051172487837450578/photo/1
偶然刷到一个开源项目 AGENTS Book Rules,把 13 本经典编程书籍的核心原则,整理成了可以直接喂给 AI 编码工具的规则文件。 涵盖《代码整洁之道》、《领域驱动设计》、《重构》等十几本经典软件工程著作的核心思想。 GitHub:https://t.co/ret6bfVd39… https://twitter.com/GitHub_Daily/status/2051150861775302660/photo/1
用 Claude Code 开发项目,有时候开着七八个终端窗口执行不同任务,来回切换很容易就搞混乱。 今天看到 Octogent 这个开源项目,正好解决多个 Claude Code 会话协同混乱的问题。 给每个任务创建独立的上下文空间,用 Markdown 文件管理任务列表和笔记,让一个 Claude Code 能派生并协调多个子 Agent… https://twitter.com/GitHub_Daily/status/2050515671629648321/photo/1
GitHub 上 Clawd Cursor 这个开源项目,给 AI 智能体装上了「眼睛和双手」,流畅操作电脑桌面。 支持控制鼠标、键盘、读取屏幕内容,运行调用任意桌面软件完成任务。 GitHub:https://github.com/AmrDab/clawdcursor 支持 Claude Code、Cursor、Windsurf 等主流编程工具直接接入。 也提供本地 REST… https://twitter.com/GitHub_Daily/status/2050479180413063618/photo/1
最近看到一个开源的桌面应用:OmniGe,把网上课程下载、视频播放、电子书阅读和笔记全整合在一个界面里。 支持从 Hotmart、Udemy 等十多个平台下载课程,下载完直接在应用内观看学习,还能对着视频打时间戳笔记。 GitHub:https://github.com/tonhowtf/omniget 阅读器部分支持 PDF、EPUB、CBZ… https://twitter.com/GitHub_Daily/status/2050425079729885238/photo/1
搞医学研究的朋友应该深有体会,从文献检索、方案设计到数据分析、论文写作。 每个环节都想借助 AI 提效,但普通 AI 缺乏严谨的医学逻辑,用起来总觉得不太靠谱。 最近看到 AIPOCH Medical Research Skills 这个项目,提供了 500 多个专为医学研究设计的 AI 智能体技能库。… https://twitter.com/GitHub_Daily/status/2050364663054172607/photo/1
GitHub 上 SkillClaw 这个开源项目,能让 AI 智能体的技能自动进化和沉淀,而且跨设备、跨智能体共享。 用起来很简单,装好后照常跟智能体对话就行,后台会自动从每次交互中提炼可复用的技能,去重、优化、归档全是静默完成的。 GitHub:https://t.co/FlAd8Z09dT… https://twitter.com/GitHub_Daily/status/2050206139598721028/photo/1
做安全渗透测试时,工具一个个手动跑,扫描完了再分析漏洞,流程繁琐且容易遗漏,效率极其低。 偶然看到 Pentest Swarm AI,号称第一个真正基于「群体智能」架构的开源渗透测试工具,不是简单的多智能体排队干活。… https://twitter.com/GitHub_Daily/status/2050153286968483866/photo/1
又在 GitHub 上看到一套浏览器自动化技能包:Browserbase Skills。 装上后,只需一句话,就能让 AI 帮我们去特定网站抓取数据、总结评论,或者进行 UI 自动化测试。 内置了反爬虫绕过、验证码自动识别以及本地 Cookie 同步功能,遇到复杂的登录状态也能处理。 GitHub:https://t.co/l5CBlqR4HT… https://twitter.com/GitHub_Daily/status/2050115524215091223/photo/1
用 Agent 自动化浏览网页,动不动就被网站识别为机器人,各种反检测插件用了一圈,还是被识别出指纹特征。 最近刷到 camofox-browser 这个项目,直接在浏览器底层伪装指纹,不是靠 JavaScript 补丁去糊弄检测。 基于 Camoufox 封装了一套专为 AI… https://twitter.com/GitHub_Daily/status/2050062696612258108/photo/1
最近看到一个开源项目 Context Mode,能有效解决 AI 编程工具上下文被超出的问题。 核心思路是让原始数据留在沙盒里,只把处理结果送进上下文窗口。 据介绍,能把 315 KB 的原始输出压缩到 5.4 KB,长度节省高达 98%。 同时用本地数据库记录会话状态,对话压缩后也能无缝恢复。… https://twitter.com/GitHub_Daily/status/2050002296533373015/photo/1
想用自己专属域名收发邮件,需折腾搭建完整邮件服务器,用第三方服务又担心数据隐私泄露。 最近 Cloudflare 团队开源的 Agentic Inbox,一个完全跑在 Cloudflare Workers 上的自托管邮箱客户端,还自带 AI 助手。 一键即可部署到自己的 Cloudflare… https://twitter.com/GitHub_Daily/status/2049843735329222955/photo/1
给网站投放广告或做 SEO,最烦的不是没数据,而是盯着一堆报表却不知道该改哪里,钱花出去了也不确定值不值。 今天看到 Toprank 这个开源 Claude Code 插件,直接让 AI 帮你分析广告账户和搜索排名,告诉你哪里在烧钱、哪里该优化。 连接 Google Ads 和 Search Console 后,AI… https://twitter.com/GitHub_Daily/status/2049790889405673965/photo/1
做营销投放广告的朋友,通常有多个平台账户,每个平台都做投放,定期统计时就头疼。 可以试下 Claude Ads 这个开源的 Claude Code 广告审计插件,专为全渠道广告打造的本地审计与优化中枢。 内置 250 多项专业审计指标,覆盖从搜索广告、社交媒体展示到短视频带货的主流投放平台。… https://twitter.com/GitHub_Daily/status/2049753135862935945/photo/1
写量化交易策略、做历史回测,光搞定各种数据接口和调试代码,就足够让人头大。 最近港大 HKUDS 团队开源的 Vibe-Trading 项目,只需一条命令,就能让你的 Agent 拥有全栈交易能力。 我们只需用自然语言描述策略想法,AI 智能体就能自动完成代码编写、运行回测,并输出详细的图表报告。… https://twitter.com/GitHub_Daily/status/2049700308788593054/photo/1
做爬虫或者 AI 自动化,一个无头 Chrome 动不动就占两三百兆内存,启动多几个机器直接宕机。 在 GitHub 上看到 Obscura 这个项目,用 Rust 写的无头浏览器引擎,专门为大规模抓取和 AI 智能体场景设计,轻量又快。 单个实例只占 30MB 内存,页面加载 85 毫秒,启动几乎瞬间完成,同时兼容 Puppeteer… https://twitter.com/GitHub_Daily/status/2049639900505686129/photo/1
每次在外面连公共 WiFi,都会被各种网页广告困扰,甚至还有可能 DNS 隐私泄露。 偶然刷到一个仅 8MB 的单文件 DNS 开源工具:Numa,装上就能挡广告、给本地服务起名字,还不用依赖任何云服务。 用 Rust 从零写的 DNS 解析器,自带缓存和 38 万条广告域名拦截,走到哪儿屏蔽到哪儿,笔记本随身携带。… https://twitter.com/GitHub_Daily/status/2049481346129748251/photo/1
每次开发 AI 应用,为了对比各大模型的价格、上下文限制和具体能力,总要在不同厂商的文档里来回翻找,费时费力。 无意间看到,OpenCode 团队开源的 https://models.dev/ 项目,恰好帮我们解决了模型信息碎片化的麻烦。 建立了一个全面的 AI… https://twitter.com/GitHub_Daily/status/2049428515276345658/photo/1
让 AI 帮我们查资料或者读源码,一旦关闭对话窗口,下次再问,AI 又得从头开始搜索阅读。 今天看到 ascent-research 这个开源项目,能让 AI 的研究工作跨会话持续积累,而不是每次都从零开始。 所有研究成果以纯文本文件保存在本地,下次继续时自动接上上回进度。 支持从网页、本地代码库、Obsidian… https://twitter.com/GitHub_Daily/status/2049390743459110924/photo/1
昨晚知名 AI 终端 Warp 宣布开源,一夜之间狂揽了 34000+ GitHub Star。 随着这两年 Agent 的发展,Warp 也从一个终端工具,逐步演变为 Agent 化开发环境(ADE)。 内置编码 Agent 开箱即用,支持接入 Claude Code、Codex、Gemini CLI 等外部 CLI Agent。 GitHub:https://t.co/0oieCSSAd5… https://twitter.com/GitHub_Daily/status/2049337906427576606/photo/1
想用 AI 生成音乐,Suno 和 Udio 每月要花几十美元订阅,生成的作品版权还受限,老是觉得不太值。 偶然看到 ACE-Step UI 这个开源项目,媲美商业平台的本地音乐生成工作台,本地运行,完全免费。 底层用开源音乐大模型 ACE-Step,能生成带人声和歌词的完整歌曲,最长超过 4… https://twitter.com/GitHub_Daily/status/2049308126760124897/photo/1
想学习 AI 编程智能体的底层原理,但大厂的 Agent 代码动辄几万行,看源码根本无从下手。 偶然看到 mini-cc 这个开源教学项目,用极简的代码复刻了主流 AI 编程助手的核心架构,很适合拿来学习。 支持接入 DeepSeek、Qwen 等主流模型,清晰展示大模型如何自主调用工具、思考和反馈。… https://twitter.com/GitHub_Daily/status/2049118966753485173/photo/1
用 Claude Code 或 Codex 同时跑几个项目,终端开一堆,还要来回编辑器,窗口多到有点头大。 刚好看到一位开发者开源了 Nezha 这款桌面应用,专门为 Agent 优先的编程模式量身打造。 直接内置原生 Claude Code 和 Codex,让多个 AI 助手能并行运行,不再需要排队等待。… https://twitter.com/GitHub_Daily/status/2049088784688619777/photo/1
用 Gemini 生成的图片右下角总带着半透明水印,直接用又不太合适,手动裁剪去除效果也不好。 于是找到 Gemini Watermark Remover 这个开源工具,一键无损去除 Gemini 生成图片的水印。 没有使用容易出现画面崩坏的 AI 重绘,而是基于反向 Alpha 混合算法进行数学级的精准还原。… https://twitter.com/GitHub_Daily/status/2049066171115471023/photo/1
辅导孩子练习英语口语,找外教太贵,用 APP 大多数又要付费订阅开通会员。 最近看到 HiKid 这个开源工具,专门给小朋友做的 AI 英语陪练,所有对话和语音处理都在本地完成,完全离线可用。 孩子对着麦克风说英语就行,不用打字,AI… https://twitter.com/GitHub_Daily/status/2049051033889100269/photo/1
在 GitHub 上看到 DS2API 这个开源项目,能把 DeepSeek 网页端的对话能力转成标准 API 接口,直接对接各种开发工具。 同时兼容 OpenAI、Claude 和 Gemini 三种主流 API 格式,现有的代码和工具基本不用改,换个地址就能用。 GitHub:https://t.co/fFmeXZWHR7… https://twitter.com/GitHub_Daily/status/2049034365582422303/photo/1
GitHub 上一份精心整理的实用 Codex 技能列表:Awesome Codex Skills。 目前收录了几十个实用技能,覆盖代码迁移、PR 审查与 CI 修复、Sentry 问题诊断、会议纪要生成、简历定制、竞品广告分析等场景。 GitHub:https://github.com/ComposioHQ/awesome-codex-skills 每个技能就是一个独立文件夹,Codex… https://twitter.com/GitHub_Daily/status/2048756589918839183/photo/1
让 AI 帮忙处理复杂编程任务时,任务一多就多个 Agent 管理混乱,上下文容易丢失。 今天在 GitHub Trending 榜单看到 Beads 这个项目,给 AI 编程助手提供了一套结构化的任务追踪系统,像是给 Agent 装了个「项目经理大脑」。 用依赖关系图来管理任务,Agent… https://twitter.com/GitHub_Daily/status/2048703734667223159/photo/1
做产品分析,用户行为追踪、A/B 测试这些功能分散在不同平台,来回切换账号和数据源,整合起来很头疼。 偶然看到 PostHog 这个开源项目,把产品分析需要的所有工具整合到了一个平台里,刚好能解决这个痛点。… https://twitter.com/GitHub_Daily/status/2048665970399731894/photo/1
用 Claude Code 写代码,经常发现它反复读同一个文件、扫整个目录只为找一个函数,token 消耗快得离谱。 最近看到 OpenWolf 这个项目,给 Claude Code 装上「第二大脑」,实测平均省下 65% 的 token 用量。 通过 6 个钩子脚本自动运行,不需要改变任何工作习惯。一条命令初始化,之后正常用 Claude… https://twitter.com/GitHub_Daily/status/2048613122949447952/photo/1
现在 AI 编码工具越来越多,Claude Code、Codex、Gemini CLI 各有各的好。 想让多个 AI 并发写代码、跑联调,却经常发愁找不到合适的调度工具。 Awesome Agent Orchestrators 这份精选指南,正好填补了工具链选择上的空白。 涵盖了能并行跑多个智能体的终端面板,以及深度融入日常工作流的个人 AI… https://twitter.com/GitHub_Daily/status/2048552744097837366/photo/1
想要复现论文里案例,要在附录里找那些隐藏的超参数,或者对着含糊其辞的公式发呆。 直接丢给大模型写代码,虽然能跑通,但分不清哪部分是原作者的意思,哪部分是 AI 凭空脑补的。 最近在 GitHub 上找到 paper2code 这个专门解决复现痛点的开源项目。 GitHub:https://t.co/mWEir4u78u… https://twitter.com/GitHub_Daily/status/2048394184181338173/photo/1
想搞懂大语言模型内部到底怎么运作的,网上大部分资料过于学术或者太浅只讲概念,找一份既有数学推导又通俗易懂的教程真挺难的。 无独有偶,最近看到 LLM Internals 这个系列教程,从分词原理一路讲到注意力机制再到推理优化,每个知识点都配了逐步数值示例。… https://twitter.com/GitHub_Daily/status/2048341338157187283/photo/1
想把网页内容喂给 AI 处理,直接复制粘贴一堆广告、导航栏、脚本代码全混在里面,手动清理太费劲。 最近看到 MD-This-Page 这个开源浏览器扩展,右键一点就能把网页转成干净的 Markdown 格式,专门为 AI 工作流设计的。 只要按下 Alt+M… https://twitter.com/GitHub_Daily/status/2048303644865634377/photo/1
平时写项目引入各种第三方依赖,省事是省事,但背后的安全漏洞往往让人防不胜防。 谷歌最近开源的 OSV-Scanner,正好能帮我们解决这个隐患。 只需一条命令,直接扫描项目源码目录,快速找出不同语言和依赖包里隐藏的已知漏洞。 不仅支持检测主流包管理器,连 Docker 容器镜像底层和 C/C++… https://twitter.com/GitHub_Daily/status/2048250747889033716/photo/1
在 GitHub 上看到 Learn Harness Engineering 这门开源课程,教我们给 AI 编程助手搭建一套可靠的工作环境。 围绕 AI 构建指令、状态、验证、范围、会话五大机制,让每次任务都有据可查、可接续、可验证。 GitHub:https://github.com/walkinglabs/learn-harness-engineering 课程包含 12 节理论课和 6… https://twitter.com/GitHub_Daily/status/2048190357951963290/photo/1
以前想画技术架构图,得学 Mermaid 语法,还要在 https://draw.io/ 里拖来拖去,想快速出一张好看的图相当麻烦。 现在可以试下 fireworks-tech-graph 这个项目,用自然语言描述系统架构,就能直接生成可发布级别的技术图表。 可作为 Claude Code 的技能插件安装,只需要简单说一句「画一个… https://twitter.com/GitHub_Daily/status/2048031796374421507/photo/1
准备 DevOps 或 SRE 面试,到处搜罗资料费时费力,也很难摸清大厂真正关心的技术细节。 最近看到 devops-interview-questions 这个硬核题库,专门收录了五十多家头部科技公司的真实面试题。 精心整理了上百道实战考题,全面覆盖 Kubernetes、Docker、Linux、网络和云服务等核心技术栈。… https://twitter.com/GitHub_Daily/status/2047978952292274553/photo/1
在 GitHub 上看到一个开源的智能体编排工具 gnhf,全称「Good Night, Have Fun」,帮我们在睡觉时让 AI 自动打工。 只需输入一句指令,就能唤起 Claude Code 或 Codex 等模型,进入全自动的代码迭代循环。 每次成功修改都会自动生成独立的 Git 提交记录,保留清晰的工作轨迹。… https://twitter.com/GitHub_Daily/status/2047941193708040351/photo/1
每天用各种 AI 编程工具辅助开发,效率确实高,但 Token 消耗往往像个黑盒,月底看到账单才感到肉疼。 最近又找到到开源工具 CodeBurn,专门用来监控和追踪各个 AI 编程工具的 Token 去向与实际成本。 兼容 Claude Code、Cursor、GitHub Copilot… https://twitter.com/GitHub_Daily/status/2047888357276160223/photo/1
用代码批量生成视频,得折腾复杂的渲染框架,或者硬啃 React 组件,门槛着实不低。 HeyGen 团队开源了 Hyperframes 这款视频渲染框架,直接提供了一种更轻量的解法。 只需要在 HTML 文件里添加特定属性,就能把普通的文字、图片和音视频转化为动态视频帧。 原生为 AI… https://twitter.com/GitHub_Daily/status/2047827986104422572/photo/1
看到一个设计不错的网站,想借鉴一下它的排版和配色,在自己项目里实现类似的效果。 最近找到 designlang 这个工具,一条命令就能把任意网站的设计元素完整提取出来,直接生成可用的配置文件。 它会用无头浏览器抓取页面,分析所有计算样式,然后输出 Tailwind 配置、CSS 变量、Figma 变量、React… https://twitter.com/GitHub_Daily/status/2047669482278293722/photo/1
偶然看到 ASCII Studio 开源项目,可视频转成实时 ASCII 字符动画,不用安装任何东西。 它能逐帧处理视频画面,通过优化的渲染管线实时生成精确的字符画,流畅度相当不错。 GitHub:https://github.com/vansh-nagar/ascii-studio 可以自定义字符密度、对比度和字符集,调出完全不同的视觉风格。… https://twitter.com/GitHub_Daily/status/2047616538698723809/video/1
想在网页上做一段手写动画效果,传统方手动绘制 SVG 路径,折腾半天效果还不一定自然。 最近看到 Tegaki 这个开源库,能把任意字体自动转换成手写动画,完全不需要手动描路径。 只需要选一个字体,传入文字内容,它就能自动生成逐笔书写的自然流畅动画效果。 GitHub:https://t.co/8y6S2aGxGz… https://twitter.com/GitHub_Daily/status/2047578819754864869/photo/1
用 AI 写技术文档,当需要生成流程图、架构图等这些可视化内容,往往需要用切换到其他的画图工具来制作。 偶然看到 Markdown Viewer 这个技能,可以让 AI 编程助手直接在 Markdown 里生成各种专业图表。 内置 14… https://twitter.com/GitHub_Daily/status/2047525971742597195/photo/1
平时我们往笔记软件里不断塞内容,真正要用的时候,翻半天也找不到,更别说把零散内容串联起来了。 最近找到 LLM Wiki 这个开源桌面应用,基于 Karpathy 的 LLM Wiki 的方法论,实现一个能自我构建的个人知识库。 跟传统的 RAG 不同,它会把文档内容编译成持久化的 Wiki… https://twitter.com/GitHub_Daily/status/2047465561291157505/photo/1
公司数据散落在各种数据库、仪表盘、数据管道里,想要理清数据的来龙去脉、追踪数据质量,经常让人无从下手。 最近看到 OpenMetadata 这个开源项目,把数据发现、数据治理、数据质量监控整合到了一个平台里,一站式管理所有数据资产的元数据。 内置 84+… https://twitter.com/GitHub_Daily/status/2047307042864738473/photo/1
开发大模型 Agent 应用,现在最头疼已不是写代码,而是上线后出了问题根本没法排查。 模型调用链路长、提示词改了效果变差、评估全靠感觉,这些问题一多就很抓狂。 最近看到 Langfuse 这个开源项目,一款专门为大模型应用打造的开源工程平台。… https://twitter.com/GitHub_Daily/status/2047254184974848397/photo/1
自由职业或者接外包项目,经常需要记录时间规划任务,试了很多工具都太臃肿,光配置就花半天。 最近看到 solidtime 这个开源时间追踪工具,界面简洁直观,专门为自由职业者和工作室设计的。 开箱即用,支持项目、任务、客户三级管理,还能给不同项目和成员分别设置计费费率,账单一目了然。… https://twitter.com/GitHub_Daily/status/2047216430270324903/photo/1
今日 GitHub Trending 榜首,Claude Context 这个开源项目专门解决 AI 编程工具的上下文窗口不够用的问题。 通过 MCP 插件,让 AI 编程助手拥有对整个代码库的语义搜索能力,精准找到相关代码。 向 AI 提问时只检索相关代码片段,不用把整个项目塞进上下文。… https://twitter.com/GitHub_Daily/status/2047163470110658731/photo/1
偶然看到 Notchprompt 这个开源小工具,利用 Mac 刘海屏旁边的空间做了个提词器。 打开后稿子自动滚动,做演示或是面试时,视线自然地落在摄像头附近,轻松应付面试官。 GitHub:https://github.com/saif0200/notchprompt 滚动速度、字体大小、面板宽高都能自由调节,还能设置倒计时,给你几秒准备时间再开始滚动。… https://twitter.com/GitHub_Daily/status/2047103191557497247/photo/1
打开多个 Claude Code 会话窗口进行不同项目开发,想随时查看 Token 消耗和限流状态,终端切来切去非常麻烦。 在 GitHub 上看到 abtop 这个工具,给 AI 编程助手打造了一块直观的系统监控面板。 在终端里一屏展示所有 Claude Code 和 Codex CLI 会话的状态,包括 Token… https://twitter.com/GitHub_Daily/status/2046944657440166032/photo/1
这模型最近爆火啊!百度文生图模型 ERNIE-Image,真是有点东西。 仅凭 8B 参数,跻身到开源文生图模型第一梯队,在消费级显卡就能跑,可作为 NanoBanana 开源平替。 GitHub:https://github.com/baidu/ernie-image 这次文字渲染能力非常不错,中英日文长文本、排版密集的人物封面,均可实现高可读性稳定输出。… https://twitter.com/GitHub_Daily/status/2046911052492001780/photo/1
在 Mac 上卸载应用,直接拖进废纸篓看似干净了,实际上缓存、配置文件、日志散落在系统各个角落,时间一长占用空间越来越多。 偶然看到 PureMac 这个开源免费的清理工具,也不收集任何数据,主打一个干净纯粹。… https://twitter.com/GitHub_Daily/status/2046854092455362739/photo/1
GitHub 上 CodeFlow 这个开源工具,能够帮助我们一键可视化整个项目的代码架构。 只需粘贴项目 GitHub 地址,就能自动生成代码架构的可视化依赖图。 选中任意文件,能直观看到改动它会影响哪些文件,还能对整个代码库打出健康评分。 GitHub:https://t.co/Xaghd9fzc0… https://twitter.com/GitHub_Daily/status/2046801202361622618/photo/1
团队每个人都在用 AI 辅助开发同个项目,遇到协作混乱、偏离需求、代码审查标准不统一等问题,项目很快就失控。 于是找到 Spec Kitty 这个开源项目,专门为 AI 打造一套完整的规范驱动开发流程。 先写需求规范,再拆技术方案,然后生成工作包,AI 逐个执行,审查通过后合并上线。每一步都有据可查。… https://twitter.com/GitHub_Daily/status/2046766336874074510/photo/1
Browser Use 团队最近开源的项目:Browser Harness,把浏览器的自由控制权完全交给 AI,让它自己完成任何浏览器操作。 仅 592 行代码,只需一个 WebSocket 连上 Chrome,就能给大模型提供自由的控制权。 具备自我修复能力,执行任务中如果发现有缺失功能,AI 会自己补写代码继续执行。… https://twitter.com/GitHub_Daily/status/2046583342519521488/photo/1
做量化交易研究,工具链通常比较很分散,AI 分析用一个,写策略用一个,回测又换一个,实盘执行还得再接一个,来回切换挺折腾的。 最近看到 QuantDinger 这个开源项目,把 AI 研究、策略开发、回测和实盘交易整合到了一个平台里,而且完全自部署。 只需简单描述一下交易想法,AI 直接生成 Python… https://twitter.com/GitHub_Daily/status/2046552028261093407/photo/1
GitHub 上一份从入门到进阶的 CUDA 开源教程:LeetCUDA,配合 PyTorch 学习,非常适合初学者。 共收录了 200 多个循序渐进的 CUDA 内核实现,涵盖从基础的元素级操作到复杂的 HGEMM 库。 GitHub:https://github.com/xlite-dev/LeetCUDA 提供完整的底层代码,还配套整理了 100… https://twitter.com/GitHub_Daily/status/2046535429386879126/photo/1
谷歌 Gemini 团队主管 Addy Osmani,最近开源的 Agent Skills,狂揽了 18000+ GitHub Star。 它把资深工程师的工作流和开发规范,封装成了 Skills 技能库,让 AI 在每个开发阶段都能保持一致的高标准。 整个项目围绕软件开发生命周期设计,覆盖定义、规划、构建、验证、评审、发布六个阶段,共计 20… https://twitter.com/GitHub_Daily/status/2046438828332998755/photo/1
老牌邮件客户端 Thunderbird 团队,最近开源了一个跨平台 AI 客户端:Thunderbolt,目标直指数据隐私和模型自由。 允许我们自由接入各种 AI 模型,无论是调用云端的 API,还是配合 Ollama 运行本地模型都没问题。 GitHub:https://github.com/thunderbird/thunderbolt 支持 Web、iOS、Android、Mac、Linux、Windows… https://twitter.com/GitHub_Daily/status/2046378454288069025/photo/1
又发现一个可生成高质量架构图或流程图的图表技能:diagram-design,挺有意思的,能自动匹配我们的网站风格。 只需给它你的网站地址,就能提取配色和字体,之后所有图表自动套用你的品牌视觉,不用再手动调样式。 GitHub:https://github.com/cathrynlavery/diagram-design 内置 13… https://twitter.com/GitHub_Daily/status/2046219865527390366/photo/1
很多时候,我们经常要在各种文档、PPT 和系统里来回切,散落各处的资料想保持一致性非常头疼。 在 GitHub 上发现 ArcKit 这个开源项目,一个面向企业架构师的治理工具包,把架构原则、需求管理、供应商招标、设计评审等环节整合成 AI 辅助的系统化工作流。 GitHub:https://github.com/tractorjuice/arc-kit 提供 68… https://twitter.com/GitHub_Daily/status/2046167027770163489/photo/1
每天有开不完的会议和看不完的文档,很多关键细节经常转头就忘,事后全想不起来在哪。 今天在 GitHub 看到 Omi,一个开源的个人 AI 记忆助手,能捕捉屏幕内容和对话,实时转录并自动生成摘要和待办。 支持桌面端、手机以及可穿戴设备,录下的内容会被整理成结构化笔记,还能通过 AI 对话随时回溯。… https://twitter.com/GitHub_Daily/status/2046129306129289428/photo/1
这两年,AI PPT 工具遍地开花。一键生成、几秒出稿,演示视频看得非常爽。 但实际效果远不如演示,生成的 PPT,想改个标题,调配色、换图标、改文案,相当麻烦。 最近看到 PPT Master 这个开源 Skill,丢进去 PDF、Word 或网页链接,直接生成真正可编辑的 PPT 文件。… https://twitter.com/GitHub_Daily/status/2046076436096975341/photo/1
使用用各种 AI 助手聊天很方便,但数据全存在别人的服务器上,对话记录、个人偏好、文件内容,自己完全没有掌控权。 最近看到 Thoth 这个开源项目,主打「个人 AI 主权」,所有数据都留在本地,模型也可以完全离线运行。 内置 25… https://twitter.com/GitHub_Daily/status/2046019973504721308/photo/1
在 GitHub 上发现一个能把任何人蒸馏成 Skill 的开源项目:dot-skill,狂揽了 15000+ Star。 只要提供目标人物的聊天记录、文档或公开资料,就能提取出一个拥有对方思考方式的 AI 技能。 不仅限于表面模仿语气,更是深度复刻对方的思维框架、决策习惯甚至情绪反应。… https://twitter.com/GitHub_Daily/status/2045857489745551732/photo/1
平时用 Claude Code 或 Codex 这类 AI 编程助手,基本在终端里敲命令行,对非技术专业的朋友来说交互不够直观。 最近在 GitHub 上看到 T3 Code 这个项目,给终端 AI 编程助手套上了一层简洁的可视化界面。 目前已支持 Codex 和 Claude Code… https://twitter.com/GitHub_Daily/status/2045804608048497019/photo/1
做 Android 逆向开发,想研究某个应用的接口请求逻辑,手动反编译再从混淆代码里找 API 调用,费时费力。 可以试下 android-reverse-engineering-skill 这个技能,专门用来反编译安卓应用并自动提取其中的接口信息。… https://twitter.com/GitHub_Daily/status/2045766851217813513/photo/1
当线上服务出现故障,运维需要在日志、监控、链路追踪和 Slack 消息等十几个工具之间来回排查,甚是折腾。 偶然看到一个专门用来构建 AI 运维智能体: OpenSRE,能帮我们自动调查和响应生产环境事故。… https://twitter.com/GitHub_Daily/status/2045714346886742098/photo/1
做 Android 逆向开发,想研究某个应用的接口请求逻辑,手动反编译再从混淆代码里找 API 调用,费时费力。 可以试下 android-reverse-engineering-skill 这个技能,专门用来反编译安卓应用并自动提取其中的接口信息。… https://twitter.com/GitHub_Daily/status/2045695303840600404/photo/1
平时用 Claude Code 或 Codex 这类 AI 编程助手,基本在终端里敲命令行,对非技术专业的朋友来说交互不够直观。 最近在 GitHub 上看到 T3 Code 这个项目,给终端 AI 编程助手套上了一层简洁的可视化界面。 目前已支持 Codex 和 Claude Code… https://twitter.com/GitHub_Daily/status/2045695255878770970/photo/1
当线上服务出现故障,运维需要在日志、监控、链路追踪和 Slack 消息等十几个工具之间来回排查,甚是折腾。 偶然看到一个专门用来构建 AI 运维智能体: OpenSRE,能帮我们自动调查和响应生产环境事故。… https://twitter.com/GitHub_Daily/status/2045695211653996839/photo/1
用 AI 开发游戏项目,随着功能不断新增和项目的迭代,缺乏系统设计的,代码很快就陷入混乱。 最近看到 Claude Code Game Studios 这个专注于游戏开发的 Claude Code 开源插件。 内置 49 个专业智能体,按真实游戏工作室的架构组织,包括创意总监、技术总监、关卡设计师、QA… https://twitter.com/GitHub_Daily/status/2045695186999931049/photo/1
各类 AI Agent 框架动辄几十万行代码,还有复杂的环境配置,光看到这些就让感到头疼。 偶然看到,一款主打极简和自我进化的自主 Agent 框架:GenericAgent,用完即进化,越用越聪明。 只有约 3000 行核心代码,内置 9 个工具,就能让大模型直接操控你的电脑,覆盖浏览器、终端、文件系统甚至手机。… https://twitter.com/GitHub_Daily/status/2045404499939086631/photo/1
在开发 AI Agent 应用时,根据报错手动微调提示词,不仅繁琐,修改记录也很难沉淀复用。 在 GitHub Trending 榜单上,看到一个专为 AI 智能体设计的自我进化引擎:Evolver。 能够自动扫描运行日志和错误模式,从中提取出关键的特征信号。… https://twitter.com/GitHub_Daily/status/2045387491415564684/photo/1
想在 Mac 上微调大模型,发现存在非常多兼容性问题,而租用云端 GPU 成本又太高。 偶然刷到 mlx-tune 这个开源项目,直接将原本专属 CUDA 的微调体验,原汁原味地搬到了苹果芯片上。 底层封装了苹果原生的 MLX 框架,并提供与 Unsloth 完全兼容的 API 接口。 GitHub:https://t.co/hlaLT0LeR7… https://twitter.com/GitHub_Daily/status/2045143202064400641/photo/1
做网站数据采集,写爬虫脚本、维护代理、处理反爬,耗时耗力,要是碰上复杂站点更是折腾。 偶然发现,一个专注网页抓取与搜索的 API 服务:XCrawl,只需配置好参数,一键就抓取任意网站数据。 地址:https://xcrawl.com/?keyword=hoboegnq 提供多种采集方式,包括单页精准抓取、全站批量爬取、站点 URL… https://twitter.com/GitHub_Daily/status/2045079826768269607/photo/1
想要上手大模型开发,网上教程要么停留在调 API,要么直接甩一堆论文公式,真正带我们从实践层面跑通的资料并不好找。 恰巧,在 GitHub 上发现《动手学大模型 Dive into LLMs》这份系列编程实践教程,由上海交通大学相关课程讲义拓展而来,完全免费开源。… https://twitter.com/GitHub_Daily/status/2045042116532023467/photo/1
给 AI Agent 接入记忆层时,传统 RAG 方案的上下文断裂、检索不精准等问题,经常让我们颇为头疼。 最近在 GitHub 上发现 Cognee 这个开源项目,只需 6 行代码就能给 AI Agent 构建持久化记忆。 核心思路是结合向量搜索与图数据库,把文档既按语义可检索,又按关系相互连接,形成统一记忆层。… https://twitter.com/GitHub_Daily/status/2044992493494964396/photo/1
用 Claude Code 写代码,想查看当前的Token 消耗、上下文长度、可用额度等信息,得来回切换查看颇为麻烦。 于是找到 ccstatusline 这个开源的 Claude Code 增强工具,把各种实时信息直接显示在终端底部。 支持展示模型信息、Git 分支与 PR 链接、Token 使用量、上下文占用、会话耗时、5 小时 Block… https://twitter.com/GitHub_Daily/status/2044928829601308881/video/1
很多朋友心里有很多做产品的想法,但真要落地时,从市场调研、写代码到后续的营销推广,往往有些力不从心。 今天在 GitHub 上看到到 Show Me The Money 这个开源技能包,能让 AI 助手变成一个全流程的商业操作系统。 内置 14 个技能,直接能帮我们自动化完成从发现商机、验证需求到开发 MVP… https://twitter.com/GitHub_Daily/status/2044770344234594411/photo/1
做短视频二创或切片号的朋友,从长视频里找高光片段、手动卡点切割,再拼合集,想必极其消耗精力。 可以试下 AutoClip 开源工具,自动完成从下载到切片再到合集生成的一整条视频剪辑流水线。 只需粘贴 YouTube 或 B 站视频链接,它就会自动下载视频和字幕,然后用 AI… https://twitter.com/GitHub_Daily/status/2044721045622636815/photo/1
做逆向分析或者抓包调试时,经常要在上千条网络请求里查找关键接口,费时费力。 偶然看到 Anything Analyzer 这个开源工具,它把抓包和 AI 深度分析直接整合在一起。 GitHub:https://github.com/Mouseww/anything-analyzer 工具内嵌浏览器,无论桌面应用、终端命令、Python 脚本、手机 App 的流量都能捕获。 然后经过… https://twitter.com/GitHub_Daily/status/2044679720990916924/photo/1
产品销量趋势、股票价格波动、话题讨论走向...我们每天都在做各种预测判断。 最近发现谷歌 Research 团队开源的 TimesFM 模型,可帮助我们预测未来,已斩获 17000+ GitHub Star。 GitHub:https://github.com/google-research/timesfm 无需样本直接上手,在 100B+… https://twitter.com/GitHub_Daily/status/2044626857900073448/photo/1
最近在 GitHub 上刷到 holaOS 这个项目,给 AI 智能体搭建了一套完整的「操作系统」。 打破单次任务运行的局限,给智能体配备了持久化记忆、专属工具,以及独立运行环境。 能让 AI 保持工作的连续性,在处理长期复杂任务时逐步积累经验,甚至实现自我进化。 GitHub:https://t.co/ih3ZFV2J8O… https://twitter.com/GitHub_Daily/status/2044566487483224205/photo/1
生化危机女主 Milla Jovovich 在 GitHub 开源了一个 AI 记忆系统:MemPalace。 起因是她和 AI 对话积累的决策、思路、调试过程,对话窗口一关全没了。 现有的记忆系统靠 AI 自己筛选什么内容值得值得记,她觉得这个思路不对。 于是她和朋友花了几个月,用 Claude Code 做出了 MemPalace。… https://twitter.com/GitHub_Daily/status/2044407930913685673/photo/1
想让 AI 替我们完成界面操作,不只是网页,还有桌面软件、各类 App。 但现实是,大部分方案靠 DOM 解析或系统 API,一换界面就容易识别错乱,根本出不了浏览器。 直到最近,在 GitHub 上发现 Mano-P 1.0,一个纯视觉 GUI 操作模型。… https://twitter.com/GitHub_Daily/status/2044355059987931256/photo/1
Markdown 编辑器不少,但想一边排版一边用 AI 辅助润色,还真不太容易找到合适的工具。 最近看到 VMark 这款开源 Markdown 编辑器,主打本地优先,文档只存在自己电脑上。 能够无缝连接 Claude 或 Gemini 等桌面端 AI 助手,帮我们在本地实现沉浸式辅助写作。 GitHub:https://t.co/FljJVw5Dml… https://twitter.com/GitHub_Daily/status/2044317323348324405/photo/1
发现 GitHub 上有一个很有意思的 Skill:「金谷园饺子馆 AI Skill」。 金谷园是北京邮电大学旁边,一家开了快 20 年的饺子馆,这个 Skill 是店老板亲自做的。 目的很简单,让大家安装该 Skill 后,可以直接向 AI 助手询问馆子的相关信息。 比如位置在哪、几点开门、WiFi… https://twitter.com/GitHub_Daily/status/2044264490133533030/photo/1
AI 帮我们写的前端页面风格千篇一律,想让它照着某个网站的设计风格来做,描述半天效果也不理想。 在 GitHub 上看到 Awesome DESIGN .md 这个项目,收集了 66 份从真实网站提取的设计规范文件,丢给 AI 就能生成风格一致的界面。 DESIGN .md 是 Google Stitch 提出的新概念,用纯 Markdown… https://twitter.com/GitHub_Daily/status/2044204120337461462/photo/1
做内容运营或 SEO 搜索优化,最麻烦的是批量生产还得兼顾质量,手动盯着生成、审核、发布,精力根本不够用。 最近在 GitHub 上看到 GEOFlow 这个开源项目,把 AI 内容生成和发布管理串成了一条完整的自动化流水线。… https://twitter.com/GitHub_Daily/status/2044045529890599253/photo/1
用 AI 辅助写代码,总得在本地折腾复杂的运行环境,不仅占用电脑资源,还容易打断工作节奏。 Vercel 团队最近开源了 Open Agents 项目,提供了一套能在后台静默运行的 AI 编程助手参考实现。 巧妙地将 AI 思考逻辑和沙盒执行环境彻底剥离,模型在外部发号施令,代码在独立的虚拟机里安全运行。… https://twitter.com/GitHub_Daily/status/2043992758877336021/photo/1
偶然在 GitHub 上发现一个可生成高质量架构图的 技能:Architecture Diagram Generator。 只需要用大白话描述系统组件和连接关系,或者直接把代码丢给 AI 分析,就能立刻生成暗黑科技风的专业架构图。 生成结果是一个独立的 HTML 文件,浏览器直接打开就能看,还能通过对话随时让 AI… https://twitter.com/GitHub_Daily/status/2043954929833046069/photo/1
做视频或者播客,想找个好用的 AI 配音工具,商业软件订阅费高不说,上传音频数据还担心隐私泄露。 于是找到 Voicebox 这个开源语音合成工具,所有模型和数据都在本地运行,可作为 ElevenLabs 的免费替代方案。 只需几秒钟的音频样本就能克隆声音,内置 5 个语音引擎,支持 23… https://twitter.com/GitHub_Daily/status/2043902094051291605/photo/1
家里抽屉吃灰的旧安卓手机,扔了可惜留着没用,想废物利用一下又不知道能干嘛。 无独有偶,看到了 linux-android 这个开源项目,能把旧安卓手机变成 Linux 桌面电脑或智能家居服务器,不需要 root,也不依赖云服务。 整个过程只需要装一个 Termux 终端,然后跑一个脚本,十几分钟就能装好完整的… https://twitter.com/GitHub_Daily/status/2043841676574380443/photo/1
有不少开发者,还在使用 IntelliJ IDEA 编辑器,想要用 Claude Code 或 Codex 模型辅助编码。 可以安装 CC GUI 这个开源插件,直接提供 Claude Code 和 Codex 可视化操作界面。 打开侧边栏即可对话,还能通过 @ 符号精准引入代码文件作为上下文,让 AI 懂我们的工程逻辑。… https://twitter.com/GitHub_Daily/status/2043683183426998724/photo/1
最近 YC 掌门人 Garry Tan 又开源了一个新项目:GBrain,给 Agent 装上第二个大脑,让它越来越懂你。 简单说,就是专为 AI 智能体打造的专属外脑和长期记忆系统。 能自动把我们的会议记录、邮件、推文和日程转化为结构化知识。 每次与 Agent… https://twitter.com/GitHub_Daily/status/2043630446328828048/photo/1
用 AI 辅助开发复杂项目,一个 Agent 单打独斗,拆任务、写模块、跑测试全靠自己,颇为低效。 今天看到 ClawTeam-OpenClaw 这个项目,让 AI 自己组建开发团队,自动分工、沟通、合并成果。 我们只需把需求描述清楚,AI 就会自动拆分任务、派活给多个智能体,各自在独立的代码分支里干活,互不冲突。… https://twitter.com/GitHub_Daily/status/2043592576255877219/photo/1
从一个想法到一本完整的小说,中间要经历构思、写作、修改、排版、插画、有声书……每个环节都够折腾人的。 最近看到 autonovel 这个项目,用 AI 智能体把写小说的全流程串了起来,从种子概念到成品一条龙搞定。… https://twitter.com/GitHub_Daily/status/2043539708970746046/photo/1
有位开发者,整理了一份国内所有小初高、大学课程的 PDF 教材:ChinaTextbook,已免费开源。 提供了高清无水印的 PDF 文件,可供大家免费下载,旨在杜绝某站上销售带有水印的付费资源。 同时也希望海外华人能够让自己的孩子继续了解国内资源,促进义务教育的普及。 GitHub:https://t.co/qqF3klWz1w… https://twitter.com/GitHub_Daily/status/2043479307193135154/photo/1
很多人写出的科研论文,在修改阶段总觉得用词不对,又很难跳出思维定势发现逻辑盲点。 偶然看到 SciWrite 这个项目,把斯坦福科学写作课的方法论做成了 AI 技能,让 AI 帮你系统审稿。… https://twitter.com/GitHub_Daily/status/2043320753769292022/photo/1
想用 AI 去做数学定理的形式化证明,大多数工具没这个能力,想自己搭一套流程又门槛极高。 无独有偶,发现 MathCode 这个开源项目,用自然语言描述数学问题,它能自动转成 Lean 4 定理并尝试完成形式化证明。… https://twitter.com/GitHub_Daily/status/2043267931568849320/photo/1
用 Claude Code 写项目,细心观察会发现 AI 会乱读一堆不相关的代码,改着改着就跑偏,token 烧得飞快,结果还不对。 偶然看到 Three Man Team 这个项目,专门给毫无纪律的 AI 设定了一套严密的协作流程。 引入了架构师、构建者和审查员三个专属角色,分别负责规划部署、严格编码以及质量审查。… https://twitter.com/GitHub_Daily/status/2043230184267219086/photo/1
想给项目加个多语言语音播报,或者对比不同 TTS 语音效果,挨个调用接口试听太费劲了。 在 GitHub 上看到 tts-samples 这个项目,直接提供了现成的语音样本库,省去了自己生成的麻烦。 基于微软 Edge 文字转语音引擎生成,覆盖 70 多种语言、300 多个声音,全部是 MP3 格式,下载即可试听。… https://twitter.com/GitHub_Daily/status/2043177323273568603/photo/1
对 AI 和大语言模型感兴趣,想了解它到底是怎么工作的,但一看那些动辄几十亿参数的模型,根本不知道从哪下手。 不妨看看 GuppyLM 这个项目,用不到 900 万参数从零训练一个会说话的「小鱼」,五分钟就能跑通整个流程。… https://twitter.com/GitHub_Daily/status/2043116931763646644/photo/1