Просто мысль, наподобие Wordcraft. Есть много хороших и несложно применимых (с точки зрения python) библиотек, на которых можно сделать умопомрачительный редактор текста.
- VOSK — распознавание речи. Есть и тяжёлая качественная, и очень лёгкая быстрая модель. Если в тишине и отчётливо говорить — то весьма хорошо очень лёгкая распознает, для команд точно подойдёт,
- rut5-base-multitask — многозадачная модель работы с текстами. 9 задач, из них перевод, составление из набора слов связного предложения, суммаризация, вставки пропущенных слов (осмысленно), и т.д.,
- MMOCR — распознаватель текстов. Tesseract и приседание со всеми этими его настройками — и итоговым качеством — нервно курит,
- RuDolph — генератор изображений по текстам и наоборот.
Складываем паззлы… в мечтах
Сижу я значит, набираю текст в блоге, и командую голосом своим, значит, «исправь!», «переведи!», «картинка!», «сканируй!».
Вот… а редактор все слушает и делает. Главное чтобы коллеги рядом не сидели, чтобы им смешно не было, для фрилансеров решение, так сказать.
Сложность тут только найти GPU под каждую модель, а то и не одну. Дорого для такого удовольствия. И не продашь — копирайтеры хоть и получают, быстрее руками набирают, а у остальных мало текста.
Такая вот заметка.
P.S. И вот совсем свежая мультимодалка, Flamingo. Просто для информации.
4 комментария на «“Бесплатно без SMS. Text Monster”»
Подписался
Круто 🙂
Побольше нужно таких вот заметок общего плана. Был бы космос приводить крактие примеры если есть на чём запускать ) Вот так было, прогнали и вот так получилось, точности всякие. Будем так говорить беглое ревью
Ну… такого контента половина Хабра и две трети медиума. Этот пост скорее случайность 🙂