jmdanto
/

titibongbong_camemBERT_NER

@@ -1,6 +1,6 @@
 ---
 language: fr
-license: apache-2.0
 tags:
 - token-classification
 - named-entity-recognition
@@ -40,7 +40,7 @@ model-index:
 **Modèle optimisé pour la reconnaissance d'entités nommées (NER) dans les rapports sociaux français**
-[![License](https://img.shields.io/badge/License-Apache%202.0-blue.svg)](https://opensource.org/licenses/Apache-2.0)
 [![Model](https://img.shields.io/badge/Model-CamemBERT-green.svg)](https://huggingface.co/camembert-base)
 ## 📋 Description
@@ -148,11 +148,13 @@ Quality impact: Minimal (<0.1% F1 degradation)
 Le modèle student distillé a été entraîné sur **50 000 phrases** provenant de trois sources complémentaires :
-1. **Contexte médico-social français** : Rapports sociaux, dossiers ASE/RSA, suivis éducatifs
 2. **Narratif littéraire** : Grands romans français du XXe siècle (dialogues, descriptions de personnages)
 3. **Articles Wikipedia français** : Contenu encyclopédique général
-Cette diversité de sources permet une bonne généralisation tout en conservant une spécialisation pour le domaine médico-social.
 ### Installation
@@ -314,18 +316,24 @@ Apache 2.0
 ```bibtex
 @model{camembert-ner-distilled-pruned-fp16,
   title={CamemBERT-NER Distilled + Pruned + FP16},
-  author={Jean-Michel Danto},
   year={2024},
   publisher={HuggingFace},
-  url={https://huggingface.co/jeanmicheldanto-boop/camembert-ner-distilled-pruned-fp16}
 }
 ```
 ## 📞 Contact
-- **Repository** : [laplume](https://github.com/jeanmicheldanto-boop/laplume_test)
-- **Issues** : [GitHub Issues](https://github.com/jeanmicheldanto-boop/laplume_test/issues)
-- **Email** : [email protected]
 ## 🔄 Versions
@@ -336,4 +344,4 @@ Apache 2.0
 ---
-**Note** : Ce modèle fait partie du projet **La Plume**, un pipeline de pseudonymisation pour documents médico-sociaux français.

 ---
 language: fr
+license: mit
 tags:
 - token-classification
 - named-entity-recognition
 **Modèle optimisé pour la reconnaissance d'entités nommées (NER) dans les rapports sociaux français**
+[![License](https://img.shields.io/badge/License-MIT-blue.svg)](https://opensource.org/licenses/MIT)
 [![Model](https://img.shields.io/badge/Model-CamemBERT-green.svg)](https://huggingface.co/camembert-base)
 ## 📋 Description
 Le modèle student distillé a été entraîné sur **50 000 phrases** provenant de trois sources complémentaires :
+1. **Contexte médico-social français** :
+   - Rapports sociaux fictifs mais réalistes (générés pour l'entraînement)
+   - Rapports publics sur l'organisation médico-sociale et bonnes pratiques
 2. **Narratif littéraire** : Grands romans français du XXe siècle (dialogues, descriptions de personnages)
 3. **Articles Wikipedia français** : Contenu encyclopédique général
+Cette diversité de sources permet une bonne généralisation tout en conservant une spécialisation pour le domaine médico-social, **sans utiliser de données confidentielles réelles**.
 ### Installation
 ```bibtex
 @model{camembert-ner-distilled-pruned-fp16,
   title={CamemBERT-NER Distilled + Pruned + FP16},
+  author={Danto, Patrick},
   year={2024},
   publisher={HuggingFace},
+  url={https://huggingface.co/jmdanto/titibongbong_camemBERT_NER}
+}
+@model{camembert-ner-teacher,
+  title={CamemBERT-NER: Fine-tuned CamemBERT for NER task},
+  author={Pollé, Jean-Baptiste},
+  year={2020},
+  publisher={HuggingFace},
+  url={https://huggingface.co/Jean-Baptiste/camembert-ner}
 }
 ```
 ## 📞 Contact
+- **Email** : patrick.[email protected]
 ## 🔄 Versions
 ---
+**Note** : Ce modèle fait partie du projet **La Plume**, un pipeline de pseudonymisation pour documents médico-sociaux français. Le pipeline complet est un projet privé protégé au titre de la propriété intellectuelle, mais ce modèle est publié sous licence MIT.