"A project for sentiment analysis on Twitter data during the COVID-19 period. Tweets were classified as positive, negative, or neutral using machine learning and deep learning models."
This project aims to analyze the emotional states of Twitter users during the COVID-19 period. It includes steps such as data collection, preprocessing, sentiment labeling, and modeling. Sentiment classification was performed using machine learning and deep learning models.
- Data Collection: 180,000 tweets were collected from Twitter using MAXQDA.
- Data Preprocessing: Text cleaning, lemmatization/stemming, word cloud creation.
- Sentiment Labeling: Sentiment labeling using polarity (positive, negative, neutral).
- Machine Learning Models: Naive Bayes, Random Forest, SVM
- Deep Learning Models: CNN, LSTM, BiLSTM
- Results: Random Forest and LSTM provided the best results.
The project utilized pre-trained word embeddings from GloVe. You can download the GloVe file used in this project from this link.
Bu proje, COVID-19 sürecinde Twitter kullanıcılarının duygusal durumlarını analiz etmeyi amaçlamaktadır. Veri toplama, önişleme, duygu etiketleme ve modelleme adımlarını içermektedir. Makine öğrenmesi ve derin öğrenme modelleri kullanılarak duygu sınıflandırması yapılmıştır.
- Veri Toplama: Twitter'dan 180,000 tweet MAXQDA kullanılarak toplandı.
- Veri Önişleme: Metin temizleme, lemmatization/stemming, wordcloud oluşturma.
- Duygu Etiketleme: Polarity (pozitif, negatif, nötr) kullanılarak duygu etiketleme.
- Makine Öğrenmesi Modelleri: Naive Bayes, Random Forest, SVM
- Derin Öğrenme Modelleri: CNN, LSTM, BiLSTM
- Sonuçlar: Random Forest ve LSTM en iyi sonuçları verdi.
Proje kapsamında önceden eğitilmiş GloVe kelime gömme dosyası kullanılmıştır. İlgili dosyayı bu bağlantıdan indirebilirsiniz.