Skip to content

Latest commit

 

History

History
86 lines (63 loc) · 6.49 KB

README.md

File metadata and controls

86 lines (63 loc) · 6.49 KB

Reviù 🤌

Descrizione del progetto

Reviù non è altro che un modello di intelligenza artificiale che rientra tra i progetti di sentiment analysis. È stato creato da noi con l'intento di essere un assistente personale che analizzi recensioni di prodotti in ambito E-commerce e ne riporti una valutazione del sentiment positiva o negativa. È però utilizzabile da chiunque per molti più scopi. È semplice, è veloce e per esempio può aiutarvi a capire i sentimenti delle persone a voi più care!

Configurazione ed uso

Installazione

Per poter usare Reviù 🤌 c'è bisogno di installare diverse librerie e l'interprete python :

  • Essendo stato testato solamente su python 3.8.8 consigliamo vivamente di installare questa versione poichè versioni precedenti o più aggiornate potrebbero non funzionare correttamente.

  • Non è necessaria l'installazione del CUDA toolkit, ne tantomeno di CuDNN, vi basterà seguire le indicazioni da noi fornite qui sotto.

  • Scaricare la repository tramite il seguente comando sul terminale oppure semplicemente utilizzando il tasto code e cliccare installa zip dopodichè estrarre il file

    git clone https://github.com/LeonardoBrutti/ReviU.git
  • Installare tutte le dipendenze contenute in requirements.txt tramite il comando:

    pip install -r requirements.txt
  • Installare il tokenizer fornito da Spacy, una libreria open source per l'elaborazione del linguaggio naturale, tramite il seguente comando:

    python -m spacy download en_core_web_sm
  • Installare torch, la libreria chiave utilizzata nel modello tramite il seguente comando:

    pip install torch==1.8.1+cu111 torchvision==0.9.1+cu111 torchaudio==0.8.1 -f https://download.pytorch.org/whl/torch_stable.html

Utilizzo

Ora che sono state scaricate tutte le dipendenze neccessarie puoi recarti all'interno del progetto e avviare il file app.py tramite IDE o tramite terminale con il comando:

python app.py

Una volta avviato lo script python bisogna aspettare circa una trentina di secondi per il caricamento del modello, una volta che viene visualizzata la seguente scritta sul terminale è possibile avviare il sito .

WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.
 * Running on http://127.0.0.1:5000
Press CTRL+C to quit

Per avviare il sito bisogna andare nella directory MVBL-SHOP e aprire il file index.html con un qualsiasi browser, dopodichè si aprirà una pagina di login con 2 possibili accessi, con le credenziali admin admin : dove è possibile vedere l'arrivo delle recensioni e la predizione fatta da Reviù🤌 e con le credenziali utente utente : dove è possibile scrivere la propria recensione, in inglese, per uno dei 4 prodotti disponibili nell'MVBL SHOP. E' consigliabile aprire due pagine una con l'accesso come utente e una con l'acesso admin per verificare l'efficenza di Reviù nella dashboard situtata nell'account admin, dopo aver lasciato una recensione nell'account utente,

Tecnologie utilizzate

Il progetto Reviù è stato sviluppato utilizzando il linguaggio di programmazione Python, attualmente testato solo su macchine windows con python 3.8.8 (versioni precendi o più aggiornate potrebbero non funzionare correttamente) e sfruttando principalmente le seguenti librerie:

  • Pytorch, inclusi i moduli aggiuntivi come torchtext, torchaudio e torchvision.
  • Pandas
  • Spacy

Il nostro modello di intelligenza artificiale si basa su una rete neurale ricorrente chiamata LSTM (Long Short-Term Memory), scelta per la sua efficacia nel gestire dati sequenziali come il linguaggio naturale.

Dataset

Il dataset utilizzato per l'addestramento del modello è : "IMDB movie review dataset", non esattamente la versione originale, ma una versione con una pulizia iniziale, contiene circa 50.000 recensioni di film in lingua inglese. Poiché non è stato possibile trovare un dataset equivalente in lingua italiana, si è optato per questo in lingua anglosassone. Il dataset è già presente tra i file del progetto col nome di movie_data.csv, ma se per qualsiasi motivo voleste riscaricarlo, questo è il comando e per eseguirlo va prima installato wget, vi lasciamo di seguito anche un link che porta ad un tutorial per l'installazione su windows.

!wget https://github.com/rasbt/python-machine-learning-book-3rd-edition/raw/master/ch08/movie_data.csv.gz

Struttura del progetto

Il progetto è suddiviso in diversi file e moduli:

  • LSTM_MODEL.py: Contiene la definizione della classe LSTM, che stabilisce il comportamento del modello durante il training, inclusi l'embedding e la funzione forward.

  • training.py: File per l'addestramento del modello, con funzioni per calcolare l'accuratezza e implementare la back propagation utilizzando algoritmi di ottimizzazione come SGD o Adam.

  • app.py: Questo file gestisce il caricamento del modello addestrato e fornisce funzioni per predirre la probabilità del sentiment. Gestisce anche la comunicazione tra il sito web e l'applicazione Python utilizzando il framework Flask.

  • index.html: Pagina di login del sito web, con due account disponibili: Admin e Utente.

  • admin.html e utente.html: Pagine web fittizie, hostate in locale, create per dimostrare il funzionamento di Reviù. Include una dashboard per gli admin da dove monitorare le recensioni, e un'area per gli utenti da dove poter scrivere le recensioni .

Approfondimenti

Se si è particolarmente interessati ai dettagli del progetto è possibile trovare una relazione tecnica qui

Crediti

La pagina di login come menzionato nella documentazione tecnica è un template che è stato utilizzato come base e che poi è stato modificato. Il template è trovabile qui. Inoltre il dataset è stato trovato qui.

Ringraziamenti

Il team MVBL desidera ringraziare l'azienda SEEWEB per l'opportunità offerta e il Dott. Marco Cristofanilli per il suo supporto durante lo sviluppo del progetto.

Contatti

Un progetto a cura di Viselli Marco e Belli Leonardo