A GLM-4-Voice, o primeiro modelo de voz de ponta a ponta da Zhipu AI, foi lançado oficialmente na plataforma aberta em 22 de janeiro. Ele pode entender e gerar diretamente voz em chinês e inglês, realizar conversas de voz em tempo real e ajustar flexivelmente características como emoção, tom, velocidade e dialeto de acordo com as instruções do usuário, tornando a interação por voz mais natural e vívida.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
A primeira API de voz de ponta a ponta do BigModel da Zhipu foi lançada
A GLM-4-Voice, o primeiro modelo de voz de ponta a ponta da Zhipu AI, foi lançado oficialmente na plataforma aberta em 22 de janeiro. Ele pode entender e gerar diretamente voz em chinês e inglês, realizar conversas de voz em tempo real e ajustar flexivelmente características como emoção, tom, velocidade e dialeto de acordo com as instruções do usuário, tornando a interação por voz mais natural e vívida.