Възможно ли е да се автоматизира следенето на общественото мнение по актуални тематики, използвайки социални мрежи?
Съвременните решения за откриване на знания в текст дават висока точност, но изискват значителен изчислителен ресурс както за обучение, така и за вграждане в софтуер. Линейните модели дават по-малка точност отколкото моделите с дълбоко обучение, но се нуждаят от драстично по-малко време и ресурси за обучение и вграждане.
На семинара ще се разгледа имплементация на мрежово приложение, което използва линейни и дълбоки модели с реални данни от Twitter.
Ще се разгледа сравнение между ресурсите, производителността и точността на различни модели.
Съдържание на доклада:
- Предварителна обработка на данните;
- Линейни модели и репрезентации – Logistic Regression, Support Vector Machine, Bag of Words, TfIdf, Doc2Vec;
- Дълбоко обучение – BERT чрез ktrain и HuggingFace;
- Използване на приложния интерфейс за програмиране на Twitter за вземане на реални данни;
- Вграждане на линейни и нелинейни модели в интернет приложения;
- Визуализиране на резултатите от класификацията.
Тази лекция се провежда в рамките на семинара „Машинно обучение“ на ИСФИ.
Трябва да влезете, за да коментирате.