Подписаться
Опубликовано

Бот: голос → саммари

Автор
  • Имя
    Нейрократия
    Telegram

Бот: голос → саммари

Я сделал бесплатного ТГ-бота, который транскрибирует голосовые сообщения и превращает их в осмысленное саммари — https://t.me/thesis_tgbot.

Кидаете боту аудио, он немного думает и возвращает вам, о чём говорит собеседник, по пунктам.

Когда может быть полезно:

— Нет возможности слушать аудио; — Нет желания читать базовое телеграмовское полотно расшифровки; — Когда аудио состоит из «эээ» и «нууу», а вам нужна суть.

Под капотом всё просто — gpt-4o-mini-transcribe для расшифровки и gpt-4o-mini для саммаризации.

Пожалуйста, помните:

— Нейросеть не знает контекста аудиосообщения и специфических слов, поэтому ожидать идеального результата в 100% случаев не стоит; — Качество расшифровки зависит от качества аудио (если вы не слышите, что говорит собеседник, нейронка тоже не услышит); — Это альфа-версия, баги ожидаемы.

В базе ограничения на 1 сообщение в минуту и аудио не длиннее 10 минут.

/ Не запрещена в РФ

Нейрократия
582 подписчика
235 постов
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #полезное

Опубликовано

Написал аутлайнер на Go для хардкорщиков

аутлайнер OCLI на Go для терминала: иерархические списки, Vim‑навигация, без облаков и ИИ, установка за 30 секунд
Опубликовано

Дайджест рассылок — прямо в Телеграм

Как собрать дайджест email‑рассылок в Telegram с помощью n8n и GPT‑4.1 Mini
Опубликовано

Email-дайджесты на автомате: мой флоу для n8n

Как создать автоматический email‑дайджест в n8n с GPT‑4.1‑mini
Опубликовано

Практика: агенты Claude Code — вне кода

Практика использования суб‑агентов Claude Code без программирования
Опубликовано

Что такое эмбеддинги — фундамент современных LLM

Что такое эмбеддинги в современных LLM и как они работают

Свежие посты

Опубликовано

OpenAI захватили гоблины

OpenAI захватили гоблиныЯ не шучу, абсолютно серьезно. Ладно, не OpenAI, а модели ChatGPT.Вчера OpenAI опубликовала странный разбор: почему...
Опубликовано

Зачем ИИ учат симулировать мир

Зачем ИИ учат симулировать мирOdyssey представила Odyssey-2 Max, свою крупнейшую модель мира. Формально это родственник видеогенераторов, но...
Опубликовано

Общество будущего от OpenAI: что с ним не так

OpenAI предлагает политику ИИ, но сохраняет выгоду компаний, усиливает концентрацию и создаёт барьеры, не решая риски безопасности.
Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.