YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Russian News Word2Vec Skip-gram 300D

Корпус

100k+ статей с российских новостных сайтов (2020-2024 годы)

Параметры обучения

  • Алгоритм: Word2Vec Skip-gram
  • Размерность: 300
  • Размер окна: 8
  • Min frequency: 5
  • Negative samples: 25
  • Эпох: 200

Метрики качества

  • Word analogy accuracy: 75.3%
  • Semantic similarity (Spearman): 0.68
  • Vocabulary coverage: 98.5%

Пример использования

from gensim.models import Word2Vec

model = Word2Vec.load("russian_news_word2vec_sg.model")

similar_words = model.wv.most_similar("путин", topn=5) print(similar_words)

result = model.wv.most_similar( positive=["париж", "россия"], negative=["москва"], topn=3 ) print(result)

Области применения

  • Семантический поиск
  • Классификация текстов
  • Анализ тональности

Ограничения

  • Обучена на новостных данных
  • Размер словаря: ~500,000 слов

Лицензия

MIT License

Модель опубликована через Hugging Face Hub

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support