开源,专为LLM设计的网页爬虫和抓取工具
开源 AI 视频、GIF 和图像超分辨率工具
上海交通大学的语音生成模型
开源版本的 Google NotebookLM ,将PDF转为音频文件(播客),基于开源模型实现
文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式
超轻量级、可以在移动端实时运行的数字人模型
开源视频同步翻译工具,可以将视频和音频翻译成几十种语言,并提供 TTS 功能
提供转录、翻译和 TTS 的最佳gradio Web-ui,使用Faster whisper自动创建字幕
开源无代码ETL工具
具备视觉、语音和双工能力的开源GPT-4o
AI将屏幕截图、模型和 Figma 设计转换为代码
Claude 3.5 Sonnet computer use 的开源平替
将YouTube、PDF、论文、网站、纯文本等多源文本转换成多语言Podcast的开源工具
Microsoft Edge 在线文本转语音服务Python接口封装,无需 Microsoft Edge 或 Windows 或 API 密钥
开源文字转语音服务,内置多个音色可供选择,并可自行上传音色与参考音频
PDF 生成中文播客
带单词时间戳的高速语音识别项目,基于 SenseVoice
语音识别模型,在长语音识别上,超过了Whisper large-v3、NVIDIA Canary-1B
基于Ollama的AI自动化研究助手
自动生成钢琴伴奏模型,将任意音乐转换成与原曲匹配的钢琴伴奏
使用 ChatGPT 进行验证码识别的开源工具
智能语音转字幕文本工具,无需 GPU 和繁琐的本地配置
高性能非结构化数据提取工具,支持微软Office、PDF、网页、图片、电子书、邮件等多种格式
公益免费的ChatGPT API
Luna AI换脸 / AI写真 / AI证件照 / AI高管照 / AI照相馆 / 妙鸭相机同款
开源提示工程平台,使用 AI 构建、评估和完善Prompt
基于OpenAI Realtime API 构建 的和PDF文档聊天工具
网络研究和总结助手,可以自动深入研究任何主题,提供带有源引用的完整研究报告
自托管AI入门套件,快速搭建本地AI开发环境,n8n 开源
类似于 GPT-o1的能够自发、系统推理的视觉语言模型
AI NSFW 内容检测器,支持检测图片、PDF、视频、压缩包中的文件
AI生成应用程序,全栈+生成式用户界面
Meta开源的用于视频水印的模型。图像水印AI模型为Watermark Anything
Linux平台电子书转有声读物命令行工具,本地转换,支持多语言
历史文献修复AI助手,可以预测并修复受损历史文献的原始外观
类似Amazon Alexa的开源AI第二大脑
一键将Markdown转海报
AI辅助软件开发平台
AI驱动的语音听写工具,转录内容可以自动插入到任何支持文本输入的应用中
ChatGPT Teams/Enterprise 的开源替代
用 Excel 实现LLM,学习AI的工作原理
AI网络搜索引擎大全
开源反检测浏览器,用于网页数据抓取,可绕过反爬虫系统检测
AI 从 PDF 中提取结构化数据
复旦大学、百度等开源的音频驱动肖像动画的项目
开源数字人课程制作平台
无代码网络数据提取平台,
开源图像超分修复框架
Google 开源的精准识别手写文字的工具
拥有基于上下文语境的人工智能翻译引擎,为网站提供更加友好的翻译
基于Vision LLM把PDF转为Markdown
Windows Recall,Rewind 的开源平替
开源社交媒体模拟器,可以真实地模仿 Twitter 和 Reddit 等平台上多达 100 万用户的行为
简单易用的一站式AI数字人系统
将学术论文转化为生动对话播客的工具,通过模拟三人讨论让复杂信息更易吸收
微软开源的能将PDF、Office 文档、图片、音频等格式文件转换为 Markdown 的实用工具
金融 AI Agent
开源AI简历优化工具,通过大语言模型来衡量您的简历与职位描述的匹配程度
自动把文档转成PPT的Agent
金融领域大语言模型应用知识库