基于本地视频和LLM的AI婴儿监视器
统一的 MCP 客户端库,可将任何LLM服务器连接到任何 MCP 服务器
用于 Web 浏览 AI 的高性能服务引擎
AI 科学家,通过代理树搜索实现研讨会级自动化科学发现
开源浏览器自动化工具(RPA 2.0),通过一次性录制浏览器操作,生成可无限运行的确定性工作流程
实时摄像头目标检测的高效解决方案
AI 驱动的知识库系统
ControlNet 开发者的新项目,高效的视频生成框架
通过将文本数据编码到视频中,实现对数百万个文本块进行闪电般的语义搜索
字节跳动开源的Deep Research框架
开源AI Deep research 搜索引擎
让FastAPI接口秒变MCP工具的零配置工具
多Agent交易框架,为投资交易提供决策
从文档中提取结构化数据和洞察,能够识别和分析文档中的关键内容
自动化的社交媒体分析工具,专门用于关注和分析社交媒体平台上的内容
微软开源的人机协作的网页自动化系统
开源TTS模型,性能媲美ElevenLabs
集成了 browser use、MCP、自动工具调用、任务规划、Deep Research等能力的 AI Agent框架
开源版DeepWiki,支持生成GitHub/Gitlab/Bitbucket仓库的Wiki
面向端侧的GUI Agent,拥有中英文APP操作能力,并基于RFT优化思考能力
让每个Coding Agent拥有独立的容器化环境,类似项目 github.com/trycua/cua
多模态Resarcher,利用Gemini 2.5原生多模态能力,搜索、研究、生成报告和播客
AI自动生成播客,给出主题/关键词,自动网络研究、LLM 脚本编写和 TTS 音频合成
AI 量化交易系统,提供从数据收集到策略执行的完整流程
面向 AI Agent的开源虚拟桌面,只需几行代码即可在虚拟桌面上部署 AI 代理
基于AI的自主进化写作系统,利用AI通过迭代竞赛来生成、评估和进化创意故事
基于AI的自动视频剪辑系统,能够自动分析视频内容并根据用户需求生成编辑后的视频
开源Deep Research
开箱即用的基于企业私有知识库的LLM大语言模型的智能客服机器人问答系统
基于Claude的AI驱动的任务管理工具,可以放到Cursor, Lovable, Windsurf, Roo中进行管理
使用本地大型语言模型 (LLM) 将视频和音频任务的简单英语描述翻译成可执行的 ffmpeg 命令
阿里发布的信息检索 Agent,可自主上网查资料,GAIA 基准超越 GPT-4o
AI 驱动客户服务系统,支持 MCP 扩展和 AI 知识库系统
开源 AI 虚拟角色系统,支持实时语音聊天、玩 Minecraft 和 Factorio
面向事件驱动选股的多智能体交易框架
用于构建具有记忆、知识和推理能力的多智能体系统的全栈框架
Windows 自动化代理,可在 GUI 层直接与 Windows 交互
基于多引擎搜索结果的模型上下文协议(MCP)服务器
基于 LMM 的轻量级文档解析模型
AI自动化工具,Zapier的开源替代
Google开源的MCP数据库工具,不到10行Python代码即可让AI智能体访问数据库
腾讯开源的智能体框架,突出优势是自动化生成智能体及其配置的能力
拥有无限可能的3D AI桌面伴侣
开源版本 Claude for Chrome, 自动化浏览器操作
一体化多模态文档处理系统
阿里巴巴开源的手机上运行的3D数字人应用,本地运行、完全离线、支持多模态交互
开源 Deep Research,AI生成调研报告
Chrome插件的 MCP 服务器,将 Chrome 浏览器功能暴露给 Claude 等 AI 助手
用于构建诸如Deep Research、Manus、Claude Code 复杂Agent的通用框架
隐形AI桌面助手,可以实时捕捉屏幕活动和音频,能理解上下文,将其转化为结构化知识
腾讯开源的机器翻译模型,支持33种语言互译,五种少数民族语言
字节跳动开源的多模态文档图像解析模型
一体化攻击安全工具箱,集成 AI 代理和 MCP 架构
使用自定义知识库和任务管理作为 MCP 服务器来增强 AI 编码助手
用于 Computer-Use Agents 的 Docker
AI驱动的 MCP 网络安全自动化平台
IBM 开源的将 REST API 转换为 MCP 的服务
NSFW Jailbreaks for various LLMs