YAML Metadata
Warning:
empty or missing yaml metadata in repo card
(https://huggingface.co/docs/hub/model-cards#model-card-metadata)
Russian News Word2Vec Skip-gram 300D
Корпус
100k+ статей с российских новостных сайтов (2020-2024 годы)
Параметры обучения
- Алгоритм: Word2Vec Skip-gram
- Размерность: 300
- Размер окна: 8
- Min frequency: 5
- Negative samples: 25
- Эпох: 200
Метрики качества
- Word analogy accuracy: 75.3%
- Semantic similarity (Spearman): 0.68
- Vocabulary coverage: 98.5%
Пример использования
from gensim.models import Word2Vec
model = Word2Vec.load("russian_news_word2vec_sg.model")
similar_words = model.wv.most_similar("путин", topn=5) print(similar_words)
result = model.wv.most_similar( positive=["париж", "россия"], negative=["москва"], topn=3 ) print(result)
Области применения
- Семантический поиск
- Классификация текстов
- Анализ тональности
Ограничения
- Обучена на новостных данных
- Размер словаря: ~500,000 слов
Лицензия
MIT License
Модель опубликована через Hugging Face Hub
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support