chatdata.ru


Изначально хотел по аналогии с timeseries.ru сделать такое веб-приложение, всё на js:

  • Закидываешь туда CSV/Excel,
  • Чатишься с данными текстовыми интентами —
    • поиск — это кластеризация, типичные представители, аномалии, просто поиск в записях,
    • прогноз — линейка или что-то по типу, для рядов тренд + сезонность, логрег тот же, может что посложнее (MLP),
    • генерация — обучение AE/VAE и генерация схожих, аналитика на них опять же, ну там Монте-Карло или что-то по типу «как часто».

Но потом подумал, а у меня ведь нет сборника статей, чтобы раз — закинул файл, а потом нашел.

Изначально думал сделать RAG на Vikhr-Llama-1B-instruct, но для этого надо виртуалочку брать, а мне не хочется держать два хостинга, я не веб-девелопер. И python уже порядком поднадоел, еще дома его не хватало 🙂

Сделал на js векторизацию через multilingual-e5-small, а векторный поиск на пыхе в MySQL. Даже работает.

Проблема конечно в full scan. Но пока статей немного, это не удручает. Начнёт удручать — всё же перееду на VPS. Пока нет и не надо.

В принципе оно даже работает — насколько работает me5. Ну и да — как туда закидывать файлы, знаю один я 🙂 Остальным не положено. Хотите — своё хранилище заводите.


Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *