University Sétif 1 FERHAT ABBAS Faculty of Sciences
Détail de l'auteur
Auteur Harrag,Fouzi |
Documents disponibles écrits par cet auteur



Titre : Automatic generation of product descriptions Type de document : texte imprimé Auteurs : Behilil ,Hamza, Auteur ; Harrag,Fouzi, Auteur Année de publication : 2021 Importance : 1 vol (57 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Product Description
Text GenerationIndex. décimale : 004 - Informatique Résumé :
Product descriptions play an important role in e-commerce websites, where they
give to customers the information needed about the product they looking for. These
websites witness a daily addition of a large number of new products especially
in fashion domain, each product needs to have its specific description. Writing
these descriptions manually is a tedious and time consuming process, so our system
comes to solve this problem by presenting an NLP system based on a transformer
model which is GPT-Neo with the help of a word embedding model (word2vec) to
generate these descriptions automatically. Our 14k dataset was collected from a famous
arabic e-commerce website called noon and it contains titles and descriptions
of different categories in fashion domain. We used our dataset to train and fine-tune
word2vec and GPT-Neo models respectively then, we combined them to create our
system which takes product title as input and give product description as output.
Evaluation of our systems showed promising results with 67% of recall and 72% of
precision.Côte titre : MAI/0533 En ligne : https://drive.google.com/file/d/1lTdODus5T0OPVo4IO2g8PInCaCuIANT5/view?usp=shari [...] Format de la ressource électronique : Automatic generation of product descriptions [texte imprimé] / Behilil ,Hamza, Auteur ; Harrag,Fouzi, Auteur . - 2021 . - 1 vol (57 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Product Description
Text GenerationIndex. décimale : 004 - Informatique Résumé :
Product descriptions play an important role in e-commerce websites, where they
give to customers the information needed about the product they looking for. These
websites witness a daily addition of a large number of new products especially
in fashion domain, each product needs to have its specific description. Writing
these descriptions manually is a tedious and time consuming process, so our system
comes to solve this problem by presenting an NLP system based on a transformer
model which is GPT-Neo with the help of a word embedding model (word2vec) to
generate these descriptions automatically. Our 14k dataset was collected from a famous
arabic e-commerce website called noon and it contains titles and descriptions
of different categories in fashion domain. We used our dataset to train and fine-tune
word2vec and GPT-Neo models respectively then, we combined them to create our
system which takes product title as input and give product description as output.
Evaluation of our systems showed promising results with 67% of recall and 72% of
precision.Côte titre : MAI/0533 En ligne : https://drive.google.com/file/d/1lTdODus5T0OPVo4IO2g8PInCaCuIANT5/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0533 MAI/0533 livre Bibliothéque des sciences Anglais Disponible
Disponible
Titre : COVID-19 Events Extraction from Arabic Twitter Type de document : texte imprimé Auteurs : Zermani,Maroua, Auteur ; Harrag,Fouzi, Directeur de thèse Editeur : Setif:UFA Année de publication : 2020 Importance : 1 vol (74 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Traitement du langage naturel
COVID-19
Reconnaissance d'entité nomméeIndex. décimale : 004 - Informatique Résumé :
Le covid-19 devenant une menace publique, prédire et suivre la propagation de ce
un nouveau virus peut être très bénéfique pour les scientifiques de la santé et les décideurs. Prévision,
n'implique pas toujours la prédiction de données numériques, comme la prédiction du nombre de
nouveaux cas dans la période suivante, il peut en fait être défini comme la prédiction d'un futur
incidence des événements en analysant les données historiques. L'un des moyens les plus efficaces
prévenir et contrôler les épidémies, c'est surveiller et suivre l'actualité et les réseaux sociaux
sur la propagation de cette maladie. Dans ce travail, nous visons à utiliser les données Twitter pour extraire
informations précieuses tirées des tweets arabes liés à la maladie Covid-19.
L'arabe est une langue très difficile en matière de traitement du langage naturel
(PNL), il est à la fois riche morphologiquement et très ambigu. La plupart des méthodes existantes
sont basés sur un modèle de pipeline qui utilise le modèle de représentation du langage traditionnel pour
l'incorporation de mots, ce qui génère des erreurs. Pour résoudre ces problèmes, nous avons proposé
utiliser un modèle d'apprentissage en profondeur capable de comprendre le contexte; jusqu'ici, AraBERT est le
meilleur modèle de représentation de la langue pour l'arabe, qui peut comprendre
des textes. Dans notre projet, nous peaufinerons le modèle pour enfin extraire un COVID-
19 entités nommées et incidence d'événements.Côte titre : MAI/0399 En ligne : https://drive.google.com/file/d/1RiyxXwU4nxp5qHiyZGcpOITse3YoDXMM/view?usp=shari [...] Format de la ressource électronique : COVID-19 Events Extraction from Arabic Twitter [texte imprimé] / Zermani,Maroua, Auteur ; Harrag,Fouzi, Directeur de thèse . - [S.l.] : Setif:UFA, 2020 . - 1 vol (74 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Traitement du langage naturel
COVID-19
Reconnaissance d'entité nomméeIndex. décimale : 004 - Informatique Résumé :
Le covid-19 devenant une menace publique, prédire et suivre la propagation de ce
un nouveau virus peut être très bénéfique pour les scientifiques de la santé et les décideurs. Prévision,
n'implique pas toujours la prédiction de données numériques, comme la prédiction du nombre de
nouveaux cas dans la période suivante, il peut en fait être défini comme la prédiction d'un futur
incidence des événements en analysant les données historiques. L'un des moyens les plus efficaces
prévenir et contrôler les épidémies, c'est surveiller et suivre l'actualité et les réseaux sociaux
sur la propagation de cette maladie. Dans ce travail, nous visons à utiliser les données Twitter pour extraire
informations précieuses tirées des tweets arabes liés à la maladie Covid-19.
L'arabe est une langue très difficile en matière de traitement du langage naturel
(PNL), il est à la fois riche morphologiquement et très ambigu. La plupart des méthodes existantes
sont basés sur un modèle de pipeline qui utilise le modèle de représentation du langage traditionnel pour
l'incorporation de mots, ce qui génère des erreurs. Pour résoudre ces problèmes, nous avons proposé
utiliser un modèle d'apprentissage en profondeur capable de comprendre le contexte; jusqu'ici, AraBERT est le
meilleur modèle de représentation de la langue pour l'arabe, qui peut comprendre
des textes. Dans notre projet, nous peaufinerons le modèle pour enfin extraire un COVID-
19 entités nommées et incidence d'événements.Côte titre : MAI/0399 En ligne : https://drive.google.com/file/d/1RiyxXwU4nxp5qHiyZGcpOITse3YoDXMM/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0399 MAI/0399 Mémoire Bibliothéque des sciences Anglais Disponible
Disponible
Titre : Determining Truth in Social Media Content Type de document : texte imprimé Auteurs : Djahli,Mohamed Khalil, Auteur ; Harrag,Fouzi, Directeur de thèse Editeur : Setif:UFA Année de publication : 2019 Importance : 1 vol (80 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Détection des infox
Fausses nouvelles
Vérification des faits
Réseaux sociaux
Approches de contenu
Corpus en arabeIndex. décimale : 004 - Informatique Résumé : L'information fallacieuse peut polariser la société, en particulier lors d'événements politiques. Les fausses nouvelles sapent la confiance dans les médias en général. De nos jours, il n’a jamais été aussi facile de diffuser de «fausses nouvelles», en particulier dans les réseaux sociaux. Compte tenu des enjeux élevés, déterminer la vérité dans les médias sociaux est récemment devenu une recherche émergente qui suscite un intérêt considérable.
Les algorithmes actuels de traitement du langage naturel ne donnent toujours pas l'interprétation des actualités. Par conséquent, l’utilisation d’approches reposant sur le contenu des actualités remet en cause la détection des caractéristiques des fausses nouvelles; nous avons
besoin d'informations auxiliaires pour la décision. Les approches basées sur ‘la propagation’ et ‘le contexte social’ peuvent constituer une stratégie alternative ou complémentaire aux approches basées sur le contenu.
Dans cette thèse, on développe un réseaux de neurones profond pour classer les vraies et les fausses revendications en exploitant les ‘Réseaux neuronals convolutifs’. Dans notre expérience, on utilise une base de données en arabe qui inclue la vérification des faits pour créer notre modèle. Ensuite, on l’entraîne en fonction de différents attributs sélectionnés. Enfin, on évalue notre modèle en comparant les résultats avec les études précédentes. On discute également des domaines de recherche connexes mais aussi des directiosn futurs de recherche concernant la détection des fausses nouvelles sur les réseaux sociaux.Note de contenu :
Sommaire
on ...................................................................................................................... 1
1.1 Problem Description ................................................................................................................. 2
1.2 Contributions ............................................................................................................................ 3
1.3 Research Goal and Objectives .................................................................................................. 3
1.4 Conclusion ................................................................................................................................ 4
Background ....................................................................................................................... 6
2.1 Definition of Fake News ........................................................................................................... 6
2.2 Social Media ............................................................................................................................. 9
2.3 Fields and Areas Related to Truth Discovery ......................................................................... 16
2.4 Post-Truth Era ........................................................................................................................ 20
2.5 Data Mining Techniques ......................................................................................................... 20
2.6 Conclusion .............................................................................................................................. 21
Related Work ................................................................................................................... 23
3.1 Discussion of the latest related work ..................................................................................... 28
3.2 Conclusion .............................................................................................................................. 29
Conceptual Model ............................................................................................................ 31
4.1 Dataset ................................................................................................................................... 31
4.2 Standard NLP Tasks ................................................................................................................ 31
4.3 ‘K’-Fold Cross-Validation ........................................................................................................ 35
4.4 Model ..................................................................................................................................... 36
4.5 Conclusion .............................................................................................................................. 40
Implementation ............................................................................................................... 42
5.1 Dataset Importation ............................................................................................................... 42
5.2 Data Pre-processing ............................................................................................................... 46
5.3 Constructing the Convolutional Neural Network ................................................................... 67
5.4 Evaluation Metrics .................................................................................................................. 73
Conclusion and Future Work ............................................................................................. 78
6.1 Conclusion .............................................................................................................................. 78
6.2 Future Work ........................................................................................................................... 78
Bibliography ................................................................................................................... 80Côte titre : MAI/0322 En ligne : https://drive.google.com/file/d/1gu8ARvRZpTOqRZIg5lNM1dUZssg8WVwO/view?usp=shari [...] Format de la ressource électronique : Determining Truth in Social Media Content [texte imprimé] / Djahli,Mohamed Khalil, Auteur ; Harrag,Fouzi, Directeur de thèse . - [S.l.] : Setif:UFA, 2019 . - 1 vol (80 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Détection des infox
Fausses nouvelles
Vérification des faits
Réseaux sociaux
Approches de contenu
Corpus en arabeIndex. décimale : 004 - Informatique Résumé : L'information fallacieuse peut polariser la société, en particulier lors d'événements politiques. Les fausses nouvelles sapent la confiance dans les médias en général. De nos jours, il n’a jamais été aussi facile de diffuser de «fausses nouvelles», en particulier dans les réseaux sociaux. Compte tenu des enjeux élevés, déterminer la vérité dans les médias sociaux est récemment devenu une recherche émergente qui suscite un intérêt considérable.
Les algorithmes actuels de traitement du langage naturel ne donnent toujours pas l'interprétation des actualités. Par conséquent, l’utilisation d’approches reposant sur le contenu des actualités remet en cause la détection des caractéristiques des fausses nouvelles; nous avons
besoin d'informations auxiliaires pour la décision. Les approches basées sur ‘la propagation’ et ‘le contexte social’ peuvent constituer une stratégie alternative ou complémentaire aux approches basées sur le contenu.
Dans cette thèse, on développe un réseaux de neurones profond pour classer les vraies et les fausses revendications en exploitant les ‘Réseaux neuronals convolutifs’. Dans notre expérience, on utilise une base de données en arabe qui inclue la vérification des faits pour créer notre modèle. Ensuite, on l’entraîne en fonction de différents attributs sélectionnés. Enfin, on évalue notre modèle en comparant les résultats avec les études précédentes. On discute également des domaines de recherche connexes mais aussi des directiosn futurs de recherche concernant la détection des fausses nouvelles sur les réseaux sociaux.Note de contenu :
Sommaire
on ...................................................................................................................... 1
1.1 Problem Description ................................................................................................................. 2
1.2 Contributions ............................................................................................................................ 3
1.3 Research Goal and Objectives .................................................................................................. 3
1.4 Conclusion ................................................................................................................................ 4
Background ....................................................................................................................... 6
2.1 Definition of Fake News ........................................................................................................... 6
2.2 Social Media ............................................................................................................................. 9
2.3 Fields and Areas Related to Truth Discovery ......................................................................... 16
2.4 Post-Truth Era ........................................................................................................................ 20
2.5 Data Mining Techniques ......................................................................................................... 20
2.6 Conclusion .............................................................................................................................. 21
Related Work ................................................................................................................... 23
3.1 Discussion of the latest related work ..................................................................................... 28
3.2 Conclusion .............................................................................................................................. 29
Conceptual Model ............................................................................................................ 31
4.1 Dataset ................................................................................................................................... 31
4.2 Standard NLP Tasks ................................................................................................................ 31
4.3 ‘K’-Fold Cross-Validation ........................................................................................................ 35
4.4 Model ..................................................................................................................................... 36
4.5 Conclusion .............................................................................................................................. 40
Implementation ............................................................................................................... 42
5.1 Dataset Importation ............................................................................................................... 42
5.2 Data Pre-processing ............................................................................................................... 46
5.3 Constructing the Convolutional Neural Network ................................................................... 67
5.4 Evaluation Metrics .................................................................................................................. 73
Conclusion and Future Work ............................................................................................. 78
6.1 Conclusion .............................................................................................................................. 78
6.2 Future Work ........................................................................................................................... 78
Bibliography ................................................................................................................... 80Côte titre : MAI/0322 En ligne : https://drive.google.com/file/d/1gu8ARvRZpTOqRZIg5lNM1dUZssg8WVwO/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0322 MAI/0322 Mémoire Bibliothéque des sciences Français Disponible
Disponible
Titre : Dreams Analysis Type de document : texte imprimé Auteurs : Laidi, Radhia, Auteur ; Harrag,Fouzi, Directeur de thèse Editeur : Setif:UFA Année de publication : 2021 Importance : 1 vol (71 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Natural language processing
Dreams
Deep learningIndex. décimale : 004 - Informatique Résumé :
With the curiosity of many of us about knowing the interpretation of the dreams and their categories: are they true dreams, pipe dreams or demonic dreams. With the difference of opinions between Westerners and Muslims about what dreams are and what are their types, and with lack of studies about dreams analysis in Arabic, we decided to focus our attention in the analysis of dreams in Arabic. Arabic is a very challenging language when it comes to Natural Language Processing (NLP), it is both morphologically rich and highly ambiguous. Most existing methods are based on a pipeline model that uses traditional language representation that generates many errors. To address this issues, we proposed an CNN deep learning model that can understand the context of dreams and classify them in the appropriate category.Côte titre : MAI/0535 En ligne : https://drive.google.com/file/d/1p-AV8sKgHHoI6zQEjbYaIZj7nwc8K2jS/view?usp=shari [...] Format de la ressource électronique : Dreams Analysis [texte imprimé] / Laidi, Radhia, Auteur ; Harrag,Fouzi, Directeur de thèse . - [S.l.] : Setif:UFA, 2021 . - 1 vol (71 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Natural language processing
Dreams
Deep learningIndex. décimale : 004 - Informatique Résumé :
With the curiosity of many of us about knowing the interpretation of the dreams and their categories: are they true dreams, pipe dreams or demonic dreams. With the difference of opinions between Westerners and Muslims about what dreams are and what are their types, and with lack of studies about dreams analysis in Arabic, we decided to focus our attention in the analysis of dreams in Arabic. Arabic is a very challenging language when it comes to Natural Language Processing (NLP), it is both morphologically rich and highly ambiguous. Most existing methods are based on a pipeline model that uses traditional language representation that generates many errors. To address this issues, we proposed an CNN deep learning model that can understand the context of dreams and classify them in the appropriate category.Côte titre : MAI/0535 En ligne : https://drive.google.com/file/d/1p-AV8sKgHHoI6zQEjbYaIZj7nwc8K2jS/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0535 MAI/0535 Mémoire Bibliothéque des sciences Français Disponible
Disponible
Titre : Food Hazard Event Extraction based on News and Social Media Type de document : texte imprimé Auteurs : Gueliani,Slimane Nadjmeddine, Auteur ; Harrag,Fouzi, Directeur de thèse Editeur : Setif:UFA Année de publication : 2019 Importance : 1 vol (74 f .) Format : 29 cm Langues : Français (fre) Catégories : Thèses & Mémoires:Informatique Mots-clés : Social media
Event Extraction
Food Hazards
Named Entity
Recurrent Neural
NetworksIndex. décimale : 004 - Informatique Résumé : Exchanging textual data is the most popular communication among social media users. It has become a
necessity for treatment. Event extraction indicates an understanding of events across social media posts
streams. Event extraction helps to take faster corrective action in natural disasters, and may save lives.
The main objective of the system is to develop specific model to detect and extract the events (incidents)
identified in the digital text. We proposed here a model based on Deep recurrent networks a to extract the
events related to food hazard from news and social media feeds, and detect named entities for those food
hazards. Then filled a food hazard template.
Later, the output data which is the food hazard template could be displayed as a warning system, or used
as decision support for stakeholders.Note de contenu : Sommaire
pter 1 ........................................................................................................................................................1
Introduction ....................................................................................................................................................1
Problematic and motivation.........................................................................................................................1
Project goals ...............................................................................................................................................2
Thesis structure............................................................................................................................................2
Chapter 2 State of the art................................................................................................................................3
State of the art ................................................................................................................................................3
Food hazards................................................................................................................................................3
Physical hazards ...........................................................................................................................................4
chemical hazards .........................................................................................................................................4
biological hazards...........................................................................................................................................4
HACCP...........................................................................................................................................................5
Social media ...................................................................................................................................................8
Data mining ....................................................................................................................................................9
Deep learning ...............................................................................................................................................15
Neural networks ...........................................................................................................................................16
Convolutional Neural Network ....................................................................................................................17
Recurrent Neural Network ...........................................................................................................................18
Text mining ..................................................................................................................................................21
Natural Language Processing ......................................................................................................................21
Information Retrieval ...................................................................................................................................21
Information Extraction .................................................................................................................................22
Named entity recognition .............................................................................................................................25
Related Works ..............................................................................................................................................30
Conclusion....................................................................................................................................................37
Chapter 3 Proposed System..........................................................................................................................38
System description .......................................................................................................................................38
System architecture ......................................................................................................................................38
System components......................................................................................................................................45
Evaluations metrics ......................................................................................................................................46
Languages and tools .....................................................................................................................................47
Conclusion....................................................................................................................................................49
Chapter 4 Implementation and Results.........................................................................................................50
Data collection process.................................................................................................................................50
Text analysis process....................................................................................................................................52
Information extraction process.....................................................................................................................56
Named entity recognition .............................................................................................................................56
Preparing input for the model.......................................................................................................................59
Preparing output for model...........................................................................................................................62
Turning data into sequences .........................................................................................................................63
Prepare the test data for scoring ...................................................................................................................63
Create the model...........................................................................................................................................63
Train the model ............................................................................................................................................64
Results and experiments...............................................................................................................................65
General Conclusion and perspectives...........................................................................................................73
Bibliography ................................................................................................................................................73
Côte titre : MAI/0323 En ligne : https://drive.google.com/file/d/1TLYW830cezsU-EYJiKnsjIFFzZCdQxst/view?usp=shari [...] Format de la ressource électronique : Food Hazard Event Extraction based on News and Social Media [texte imprimé] / Gueliani,Slimane Nadjmeddine, Auteur ; Harrag,Fouzi, Directeur de thèse . - [S.l.] : Setif:UFA, 2019 . - 1 vol (74 f .) ; 29 cm.
Langues : Français (fre)
Catégories : Thèses & Mémoires:Informatique Mots-clés : Social media
Event Extraction
Food Hazards
Named Entity
Recurrent Neural
NetworksIndex. décimale : 004 - Informatique Résumé : Exchanging textual data is the most popular communication among social media users. It has become a
necessity for treatment. Event extraction indicates an understanding of events across social media posts
streams. Event extraction helps to take faster corrective action in natural disasters, and may save lives.
The main objective of the system is to develop specific model to detect and extract the events (incidents)
identified in the digital text. We proposed here a model based on Deep recurrent networks a to extract the
events related to food hazard from news and social media feeds, and detect named entities for those food
hazards. Then filled a food hazard template.
Later, the output data which is the food hazard template could be displayed as a warning system, or used
as decision support for stakeholders.Note de contenu : Sommaire
pter 1 ........................................................................................................................................................1
Introduction ....................................................................................................................................................1
Problematic and motivation.........................................................................................................................1
Project goals ...............................................................................................................................................2
Thesis structure............................................................................................................................................2
Chapter 2 State of the art................................................................................................................................3
State of the art ................................................................................................................................................3
Food hazards................................................................................................................................................3
Physical hazards ...........................................................................................................................................4
chemical hazards .........................................................................................................................................4
biological hazards...........................................................................................................................................4
HACCP...........................................................................................................................................................5
Social media ...................................................................................................................................................8
Data mining ....................................................................................................................................................9
Deep learning ...............................................................................................................................................15
Neural networks ...........................................................................................................................................16
Convolutional Neural Network ....................................................................................................................17
Recurrent Neural Network ...........................................................................................................................18
Text mining ..................................................................................................................................................21
Natural Language Processing ......................................................................................................................21
Information Retrieval ...................................................................................................................................21
Information Extraction .................................................................................................................................22
Named entity recognition .............................................................................................................................25
Related Works ..............................................................................................................................................30
Conclusion....................................................................................................................................................37
Chapter 3 Proposed System..........................................................................................................................38
System description .......................................................................................................................................38
System architecture ......................................................................................................................................38
System components......................................................................................................................................45
Evaluations metrics ......................................................................................................................................46
Languages and tools .....................................................................................................................................47
Conclusion....................................................................................................................................................49
Chapter 4 Implementation and Results.........................................................................................................50
Data collection process.................................................................................................................................50
Text analysis process....................................................................................................................................52
Information extraction process.....................................................................................................................56
Named entity recognition .............................................................................................................................56
Preparing input for the model.......................................................................................................................59
Preparing output for model...........................................................................................................................62
Turning data into sequences .........................................................................................................................63
Prepare the test data for scoring ...................................................................................................................63
Create the model...........................................................................................................................................63
Train the model ............................................................................................................................................64
Results and experiments...............................................................................................................................65
General Conclusion and perspectives...........................................................................................................73
Bibliography ................................................................................................................................................73
Côte titre : MAI/0323 En ligne : https://drive.google.com/file/d/1TLYW830cezsU-EYJiKnsjIFFzZCdQxst/view?usp=shari [...] Format de la ressource électronique : Exemplaires (1)
Code-barres Cote Support Localisation Section Disponibilité MAI/0323 MAI/0323 Mémoire Bibliothéque des sciences Français Disponible
DisponiblePermalinkPermalinkPermalinkPermalink