LLM Utilities

Home/LLM Utilities

Sort:

Default Most Stars Recent Name

Filters

Has websiteFeatured only

Bark

Suno

32.0k

Text-to-speech model from Suno

ttsspeechsuno

Coqui TTS

Coqui

28.0k

Deep learning toolkit for text-to-speech

ttsdeep-learningtoolkit

XTTS

Coqui

4.2k

Cross-lingual text-to-speech synthesis

ttsmultilingualcoqui

Piper

Rhasspy

4.5k

Fast local neural text-to-speech

ttslocalfast

OpenVoice

MyShell

24.0k

Instant voice cloning by MyShell

voicecloningmyshell

RVC

RVC Project

18.0k

Retrieval-based voice conversion

voiceconversionsinging

Tortoise TTS

neonbjb

11.0k

Multi-voice text-to-speech system

ttsmulti-voicequality

StyleTTS2

yl4579

4.2k

Human-level text-to-speech synthesis

ttsstylequality

CLIP

OpenAI

22.0k

OpenAI's image-text model

visiontextmultimodalFeatured

BLIP

Salesforce

4.2k

Salesforce's vision-language model

visionlanguagesalesforce

LLaVA

Microsoft

16.0k

Large Language and Vision Assistant

visionmultimodalassistant

CogVLM

THUDM

5.2k

Visual language model from Tsinghua

visionlanguagechinese

Qwen-VL

Alibaba

3.8k

Alibaba's vision-language model

visionlanguagealibaba

InternVL

Shanghai AI Lab

3.2k

Open multimodal dialogue model

visiondialogueinternlm

Florence-2

Microsoft

2.8k

Microsoft's vision foundation model

visionfoundationmicrosoft

Fuyu

Adept

2.4k

Adept's multimodal model

visionmultimodaladept

Idefics

Hugging Face

2.2k

Hugging Face's open VLM

visionhuggingfaceopen-source

MiniGPT-4

Vision-CAIR

24.0k

Vision-language understanding with GPT-4

visiongpt4understanding

GroundingDINO

IDEA-Research

5.2k

Open-set object detection with text

detectiongroundingdino

Filters

Bark

Coqui TTS

XTTS

Piper

OpenVoice

RVC

Tortoise TTS

StyleTTS2

CLIP

BLIP

LLaVA

CogVLM

Qwen-VL

InternVL

Florence-2

Fuyu

Idefics

MiniGPT-4

GroundingDINO

SAM

SAM 2