PDF2Audio - Converter PDFs em áudio

PDF2Audio AI

3 | 84 | 0
Tipo:
Projetos de Código Aberto
Última atualização:
2025/07/08
Descrição:
PDF2Audio é um modelo de IA de código aberto que transforma PDFs em saídas de áudio personalizáveis para podcasts, palestras e resumos.
Compartilhar:

Visão geral da ferramenta

PDF2Audio AI é uma ferramenta inovadora de código aberto desenvolvida pela LAMM MIT que aproveita a IA para converter PDFs em conteúdo de áudio envolvente. Os usuários podem criar podcasts, palestras e resumos com vozes e modelos de instrução personalizáveis. Utilizando modelos OpenAI GPT para a conversão de texto em fala, o PDF2Audio AI permite o carregamento de vários arquivos PDF, a personalização da geração de texto e dos modelos de áudio, e a capacidade de fornecer instruções introdutórias e de prelúdio. Esta ferramenta é ideal para educadores, criadores de conteúdo e qualquer pessoa que procure reaproveitar documentos PDF em formatos de áudio acessíveis, melhorando o aprendizado e o consumo de informações por meio da criação de áudio com tecnologia de IA.

Links Similares

Form2Agent AI
Imagem não disponível
133 0

Melhore sua aplicação com Form2Agent AI, uma solução de IA assistida por voz que melhora a experiência do usuário e garante uma entrada de dados precisa e manipulação de conteúdo com suporte para texto, voz e arquivos, integrando-se facilmente em sua aplicação web ou móvel existente.

IA
Assistência de voz
Tradepost.ai
Imagem não disponível
131 0

Tradepost.ai: Inteligência de mercado orientada por IA para negociações mais inteligentes. Análise em tempo real de notícias, newsletters e arquivos SEC.

Trading de IA
análise de mercado
Amanu
Imagem não disponível
163 0

Crie aplicativos Telegram para startups de IA rapidamente. Chatbots, Mini Apps e infraestrutura de IA. Da ideia ao MVP em 4 semanas.

IA
Telegram
Chatbots
AutoCut
Imagem não disponível
173 0

AutoCut é um plugin para Premiere Pro e DaVinci Resolve que usa IA para adicionar legendas animadas, remover silêncios, editar podcasts e muito mais.

Edição de vídeo com IA
sync.
Imagem não disponível
121 0

sync. labs oferece um editor de vídeo AI revolucionário com sincronização labial em tempo real e tradução perfeita para alcance global. Envie vídeo e sincronize os lábios com qualquer áudio ou texto.

Vídeo AI
sincronização labial
Replica Studios
Imagem não disponível
165 0

IA de voz econômica para desenvolvedores e criadores de jogos. Soluções de texto para voz e voz para voz de ponta em vários idiomas, seguras para uso comercial. Comece hoje mesmo.

IA de voz
Texto para voz
Voz de IA
LlamaIndex
Imagem não disponível
125 0

LlamaIndex é uma estrutura flexível para construir assistentes de conhecimento usando LLMs conectados a dados empresariais, habilitando o rápido deploy de soluções impulsionadas por IA.

LLM
gerenciamento de conhecimento
昇思MindSpore
Imagem não disponível
191 0

A estrutura de IA de código aberto MindSpore da Huawei. Diferenciação automática e paralelização, um treinamento, implantação multi-cenário. Estrutura de treinamento e inferência de aprendizado profundo que oferece suporte a todos os cenários da nuvem do lado do terminal, usada principalmente em visão computacional, processamento de linguagem natural e outros campos de IA, para cientistas de dados, engenheiros de algoritmos e outras pessoas.

Estrutura de IA
Aprendizado profundo
myGPTReader
Imagem não disponível
128 0

myGPTReader: Chatbot de IA para ler e resumir páginas da web, documentos e vídeos do YouTube, com tecnologia chatGPT.

Chatbot de IA
chatGPT