Новейший инструмент искусственного интеллекта Meta для бесперебойной коммуникации

В гонке за лучшее в сфере искусственного интеллекта Meta делает шаг вперед, чтобы облегчить общение людям, говорящим на разных языках. Компания представила последнее обновление инструмента перевода с использованием искусственного интеллекта, которое сделает разговоры более спонтанными. Его новая модель искусственного интеллекта поддерживает несколько языков текста и речи, которые настроены на обнаружение и добавление выражения в перевод. Более того, он приближается к переводу в реальном времени с двухсекундной задержкой перевода речи.

Что такое SeamlessM4T v2?

SeamlessM4T — это модель перевода, выпущенная Meta в августе 2023 года. Она демонстрирует потенциал бесшовных коммуникаций с новыми функциями новейшей архитектуры v2 с расширением. В настоящее время он поддерживает около 100 языков текстовых сообщений и 36 языков распознавания речи. Эта модель будет работать с переводом речи в речь, речь в текст и текст в речь и обеспечивать результаты с автоматическим распознаванием речи.

Бесшовный

«SeamlessExpressive» — один из двух прорывов в области бесшовной коммуникации. Он пытается освободиться от роботизированного голоса и добавить выражения, чтобы сделать его более понятным для пользователя. Поскольку он добавляет к переведенному голосу громкость, высоту голоса, эмоциональный тон и паузы, чтобы слушатель мог легко понять эмоцию.

Проверьте это демонстрационная страница для бесшовного общения для демонстраций на английском, испанском, французском и немецком языках.

демонстрационная страница для бесшовного общения

Вторая функция бесшовной связи — «бесшовная потоковая передача». Благодаря этому вы услышите перевод сразу после того, как говорит говорящий. Теперь вам не нужно ждать завершения предложения или фразы для ее перевода. С небольшой задержкой в ​​две секунды вы сможете быстро услышать переведенную речь. Мета пояснила, что трудно начать перевод без промедления, поскольку в разных языках существуют разные структуры формирования предложений. Поэтому они работали над разработкой специального алгоритма, чтобы понять, имеет ли аудиовход достаточный контекст для начала создания переведенного вывода или нет.

Чего можно ожидать?

Инструмент «Бесшовный перевод» компании Meta обеспечивает общение между разными языками в режиме реального времени. Мы можем ожидать, что это поможет нам эффективно общаться с людьми, говорящими на разных языках. Интеграция умных очков может внести революционные изменения в модель переводчика с искусственным интеллектом. Благодаря «SeamlessExpression» все больше и больше людей могут смотреть контент на разных языках и подключаться по всему миру.

Однако Meta не назвала даты его публичного релиза. Следовательно, мы не уверены, когда эта технология станет доступной для повседневного использования. Будем надеяться, что благодаря новой возможности легко связывать пользователя с другими посредством перевода речи люди воспримут этот сдвиг.

Что ты об этом думаешь? Дайте нам знать в комментариях ниже. Подпишитесь на нас в Фейсбук, Твиттер, YouTube, Инстаграм, флипборд, и Пинтерест.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *