Изначально хотел по аналогии с timeseries.ru сделать такое веб-приложение, всё на js:
- Закидываешь туда CSV/Excel,
- Чатишься с данными текстовыми интентами —
- поиск — это кластеризация, типичные представители, аномалии, просто поиск в записях,
- прогноз — линейка или что-то по типу, для рядов тренд + сезонность, логрег тот же, может что посложнее (MLP),
- генерация — обучение AE/VAE и генерация схожих, аналитика на них опять же, ну там Монте-Карло или что-то по типу «как часто».
Но потом подумал, а у меня ведь нет сборника статей, чтобы раз — закинул файл, а потом нашел.
Изначально думал сделать RAG на Vikhr-Llama-1B-instruct, но для этого надо виртуалочку брать, а мне не хочется держать два хостинга, я не веб-девелопер. И python уже порядком поднадоел, еще дома его не хватало 🙂
Сделал на js векторизацию через multilingual-e5-small, а векторный поиск на пыхе в MySQL. Даже работает.
Проблема конечно в full scan. Но пока статей немного, это не удручает. Начнёт удручать — всё же перееду на VPS. Пока нет и не надо.
В принципе оно даже работает — насколько работает me5. Ну и да — как туда закидывать файлы, знаю один я 🙂 Остальным не положено. Хотите — своё хранилище заводите.