快速筛选

回家地址： judh.pages.dev | rentry.org/judh | judh.top

AI其他

开源，专为LLM设计的网页爬虫和抓取工具

开源 AI 视频、GIF 和图像超分辨率工具

上海交通大学的语音生成模型

Open NotebookLM

Open NotebookLM

开源版本的 Google NotebookLM ，将PDF转为音频文件（播客），基于开源模型实现

pdf-extract-api

pdf-extract-api

文档解析和提取 API，支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式

Ultralight-Digital-Human

Ultralight-Digital-Human

超轻量级、可以在移动端实时运行的数字人模型

开源视频同步翻译工具，可以将视频和音频翻译成几十种语言，并提供 TTS 功能

提供转录、翻译和 TTS 的最佳gradio Web-ui，使用Faster whisper自动创建字幕

开源无代码ETL工具

具备视觉、语音和双工能力的开源GPT-4o

screenshot-to-code

screenshot-to-code

AI将屏幕截图、模型和 Figma 设计转换为代码

Claude 3.5 Sonnet computer use 的开源平替

将YouTube、PDF、论文、网站、纯文本等多源文本转换成多语言Podcast的开源工具

Microsoft Edge 在线文本转语音服务Python接口封装，无需 Microsoft Edge 或 Windows 或 API 密钥

Speech-AI-Forge

Speech-AI-Forge

开源文字转语音服务，内置多个音色可供选择，并可自行上传音色与参考音频

PDF 生成中文播客

带单词时间戳的高速语音识别项目，基于 SenseVoice

语音识别模型，在长语音识别上，超过了Whisper large-v3、NVIDIA Canary-1B

Automated-AI-Web-Researcher-Ollama

Automated-AI-Web-Researcher-Ollama

基于Ollama的AI自动化研究助手

自动生成钢琴伴奏模型，将任意音乐转换成与原曲匹配的钢琴伴奏

openai-captcha-detection

openai-captcha-detection

使用 ChatGPT 进行验证码识别的开源工具

智能语音转字幕文本工具，无需 GPU 和繁琐的本地配置

高性能非结构化数据提取工具，支持微软Office、PDF、网页、图片、电子书、邮件等多种格式

FREE-CHATGPT-API

FREE-CHATGPT-API

公益免费的ChatGPT API

Luna AI换脸 / AI写真 / AI证件照 / AI高管照 / AI照相馆 / 妙鸭相机同款

开源提示工程平台，使用 AI 构建、评估和完善Prompt

Voice Chat with PDFs

Voice Chat with PDFs

基于OpenAI Realtime API 构建的和PDF文档聊天工具

Research Rabbit

Research Rabbit

网络研究和总结助手，可以自动深入研究任何主题，提供带有源引用的完整研究报告

Self-hosted AI starter kit

Self-hosted AI starter kit

自托管AI入门套件，快速搭建本地AI开发环境，n8n 开源

类似于 GPT-o1的能够自发、系统推理的视觉语言模型

AI NSFW 内容检测器，支持检测图片、PDF、视频、压缩包中的文件

AI生成应用程序，全栈+生成式用户界面

Meta开源的用于视频水印的模型。图像水印AI模型为Watermark Anything

QuickPiperAudiobook

QuickPiperAudiobook

Linux平台电子书转有声读物命令行工具，本地转换，支持多语言

历史文献修复AI助手，可以预测并修复受损历史文献的原始外观

类似Amazon Alexa的开源AI第二大脑

markdown-to-image

markdown-to-image

一键将Markdown转海报

AI辅助软件开发平台

AI驱动的语音听写工具，转录内容可以自动插入到任何支持文本输入的应用中

Llama Workspace

Llama Workspace

ChatGPT Teams/Enterprise 的开源替代

AI by Hand Excel

AI by Hand Excel

用 Excel 实现LLM，学习AI的工作原理

AI网络搜索引擎大全

开源反检测浏览器，用于网页数据抓取，可绕过反爬虫系统检测

AI 从 PDF 中提取结构化数据

复旦大学、百度等开源的音频驱动肖像动画的项目

开源数字人课程制作平台

无代码网络数据提取平台,

开源图像超分修复框架

Google 开源的精准识别手写文字的工具

拥有基于上下文语境的人工智能翻译引擎，为网站提供更加友好的翻译

基于Vision LLM把PDF转为Markdown

Windows Recall，Rewind 的开源平替

开源社交媒体模拟器，可以真实地模仿 Twitter 和 Reddit 等平台上多达 100 万用户的行为

简单易用的一站式AI数字人系统

Paper-to-Podcast

Paper-to-Podcast

将学术论文转化为生动对话播客的工具，通过模拟三人讨论让复杂信息更易吸收

微软开源的能将PDF、Office 文档、图片、音频等格式文件转换为 Markdown 的实用工具

AI Financial Agent

AI Financial Agent

金融 AI Agent

开源AI简历优化工具，通过大语言模型来衡量您的简历与职位描述的匹配程度

自动把文档转成PPT的Agent

LLMs-in-Finance

LLMs-in-Finance

金融领域大语言模型应用知识库