Excalidraw 开源了文本到图表的功能
支持实时文生图或者图生图
可以与任何内容聊天的私人ChatGPT
可以自托管的Whisper实时语音转录服务
开源功能强大、易于使用的面部识别和分析工具
专门为苹果M系列芯片定制的神经网络框架
从有声读物生成视频幻灯片的AI工具
开源辅助驾驶应用,可以运行在Windows/Linux/Android
阿里巴巴达摩院开源的基础语音识别工具包
为医学领域特别设计的大语言模型
实时草图转图像
利用GPT 4V,让AI看着电脑屏幕,自主使用鼠标和键盘来完成任务
ChatGPT套壳开源程序大集合
苹果多模态大模型,可以准确识别图像并描述其内容
图像增强工具,可以提高 SDXL的图像生成分辨率
开源AI视频搜索引擎
人和AI协同创作的创新的写作工具
集成ChatGPT+Midjourney+GPTs+TTS+Whisper 的开源UI框架
AI副业赚钱资讯信息的大合集
开源聊天机器人框架,支持一键部署
开源AI实时生成艺术画工具
提供从 Youtube 下载视频并转为音频、内容总结、文本转录一条龙服务
生肉翻译软件
开源日语文本转语音
AI生成3D骨骼动画
高质量、大规模的数学语料库
多功能即时语音克隆
macOS AI 助手
训练LLM成为吐槽能手
集成AI的开源日记软件
让AI模仿人类在手机上操作APP
用AI在几秒钟内生成你想要的Excel公式
极简的人声和背景音乐分离工具,本地化网页操作
支持GeminiPro Vision / Cloudflare Workers AI / ChatGPT的融合Web平台
实时交互绘画生成图像工具
开源的聊天机器人Web UI框架
高效便携的歌曲人声抠除工具
用不到15分钟内部署一个应用,利用AI将任意视频完美翻译成任意语言并实现唇语同步
适用于中文的语音克隆,支持通过5秒音频克隆、1分钟音频克隆,也支持通过完整训练来克隆
只有 50M 参数的小语言模型“国际象棋 GPT”
基于 Google Gemini 的网页客户端,对标 ChatGPT 3.5,操作逻辑同 ChatGPT 3.5 一致
离线运行的本地语音识别转文字工具
音频处理工具,以闪电般的速度进行音频到文本转录,还提供音频修复功能,播客必备助手
开源AI笔记应用,可以在本地运行模型
全自动视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译好的带字幕的视频
一键文本转视频的工具
生成式AI相关资源大汇总
根据给定的话题自动生成Youtube短视频
开源AI贴纸生成工具
把大头照变为贴纸
开源 DiT系统,可以实现文本到视频生成(类似Sora)和文本到图像生成
一个端到端的AI主播定制模块
AI程序员 Devin 的开源替代
Prompt优化框架,旨在增强和完善提示,以适应实际应用场景
中文Mixtral混合专家大模型
利用 Claude 3 Opus 和 Haiku 模型对指定的股票全面分析和推荐
AI漫画工厂,自动生成有情感、有故事性的漫画
视频生成多代理框架,旨在复制和扩展 OpenAI 的 Sora 的功能
利用大模型,一键生成短视频