SentenceTransformer based on Snowflake/snowflake-arctic-embed-m
This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-m. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: Snowflake/snowflake-arctic-embed-m
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
'Қазіргі уақытта елімізде бəсекеқабілетті өнімдерді өндіруге негізделген жаңа ақпараттық технологияларды игеру, республикамыздың индустрия жəне ғылыми техникадағы əлеуетін дамыту басты стратегиялық міндеттердің бірі болып отыр. Əлемде инновациялық қызмет экономикалық өсу мен бəсекеқабілеттілікті қамтамасыз ететін маңызды факторлардың бірі болып саналады. Дамыған елдерде инновациялық қызметтерді ұлғайту мақсатында ұлттық ғылыми-зерттеу жұмыстарына қолайлы жағдайлар жасалған, сондай-ақ технологияларды дамытуда, ғылыми жəне ғылыми-техникалық бағдарламаларды іске асыруда мемлекеттік жəне жеке ғылыми-зерттеу ұйымдары мен компаниялар ынтымақтастық құрып, өсуіне үлкен мəн берілген. Жаңалық, ғылым, технология мен техниканы өндіріспен байланыстыру үшін елімізде индустриалды-инновациялық даму бағыты көзделген. Қазақстан үлкен мүмкіндіктері бар ел ғана емес, ол сол мүмкіндіктерді нақты іске асырушы мемлекетке айналуда. Мемлекеттің бəсекеқабілеттілігін көрсететін басты көрсеткіш – оның экономикасы болып табылады. Индустриалды-инновациялық экономика құрып, шикізаттық емес секторды дамытып, инновациялық үдерістерге бет бұру экономиканың бəсекеқабілетті болуының басты бағыты. Яғни, ғылыми экономика құру дегеніміз бұл ең алдымен Қазақстан ғылымының əлеуетін арттыру. Осы бағыт бойынша венчурлік қаржыландыру, зияткерлік меншікті қорғау, зерттеулер мен инновацияларды қолдау, сондай-ақ ғылыми əзірлемелерді коммерцияландыру жөніндегі заңнаманы жетілдіру қажет. Ғылымды қаржыландыру көлемін біртіндеп арттырып, оны дамыған елдердің көрсеткіштеріне жеткізу жөнінде нақты жоспар қажет [1]. 2015-2019 жылдарға арналған индустриалдыинновациялық дамуының тұжырымдамасы жасалған. Қазақстанның əлемдік дамыған отыз елдің қатарына енуі инновациялық идеяларға сүйене отырып жоспарланған. Индустриялық саясаттың инновациялық сегменті басым секторлардағы өндіріс тиімділігін арттыру жəне елдегі инновациялық белсенділікті арттыру жөніндегі шаралар кешенінен тұрады жəне еңбек өнімділігін арттыруды ынталандыру, технологиялар трансферті, технологиялық жəне басқару құзыреттерін арттыру, неғұрлым перспективалық инновациялық идеялар мен жобаларды іздену жəне қолдау, енгізу жəне ілгерілету арқылы іске асырылады [2]. Сондай-ақ, ел экономикасын бағалау көрсеткіштерінің біріне фирмалардың инновациялық белсенділік деңгейі жатады. Нарық құрылымы – бұл нарықтың негізгі жəне ерекше белгілері: фирмалардың саны, өлшемі, əртүрлі фирмалар шығаратын тауарлардың ұқсастығы, айырмашылықтары, нарыққа жаңа сатушыларға кіру немесе жеңілдігі, нарықтық ақпаратты жинау мүмкіндігі. Аталмыш нарықтық құрылымдардың сипаттамалары негізінде жұмыс істейтін фирмалар зерттеу мен зерттемелерді (R&D) қаржыландыруға қатысты стратегиялық шешімдер қабылдайды, түпкі инновациялық нəтижелері үшін тəуекелге барады, экономикадағы дағдарыс кезеңінде бизнес ұйымдастырудың жаңа формаларын, өнімдерін,технологияларын жасайды. Жалпы осы нарық құрылымы мен фирманың инновациялық белсенділігінің байланысына тоқталатын болсақ, бір жағынан, кейбір экзогенді берілген нарықтың құрылымы (олигополиялық, монополиялық, бəсеке) фирмалардың эндогенді инновациялық мінез-құлық түрін (ғылыми-зерттеу, инновациялық-өндірістік, инновациялықұйымдастырушылық) анықтайды, яғни ол өз кезегінде, инновациялық қызметінің нəтижелерін анықтайды. Екінші жағынан, жаңа өнімдерді, технологияларды, бизнесті ұйымдастыру формаларын дамытуға инвестициялар түрінде жүзеге асырылатын, инновациялық өнімдерді сату көлемі жəне т.б. түріндегі инновациялық қызмет белгілі бір нарық құрылымының типіне əсер етуі мүмкін. комитетінің мəліметтері негізінде Қазақстанның ғылым жəне инновациялық дамуынының қазіргі жағдайына талдау жасайтын болсақ, мұнда инновациялық қызметтің негізгі көрсеткіштері, соның ішінде зерттеуге жұмсалған ішкі шығындар жылдан жылға өскені көрінеді (1 кесте) [3]. Кестеден көріп отырғанымыздай, 2010-2014жж. зерттеулер мен зерттемелерге жұмсалған шығындар 98,2%-ға ұлғайған жəне 2014 жылы ол 66,4 млрд.теңгені құраған. Сонымен бірге, ЖІӨ-ге қатысты ішкі шығындар 2010 жылы 0,15% құраса, 2014жылы 0,17% құрады, яғни осы кезеңде 13,3 %-ға өскен. Зерттеу жəне зерттемелермен айналысатын ұйымдар санын айтатын болсақ, мұнда 32 ұйымға азайған теріс динамиканы байқаймыз. Егер 2010 жылы зерттеумен 424 ұйым айналысса, 2014 жылы тек 392 ұйым ғана айналысқан. Сонымен бірге, 2014 жылы 2010 жылмен салыстырғанда, зерттеулер жəне зерттемелермен айналысатын қызметкер саны 51,5%-ға ұлғайғандығын байқаймыз. Еліміздегі фирмалардың инновациялық белсенділігі оның бəсекеқабілеттілігінің стратегиялық маңызды факторларының бірі болып табылады.',
'Қазіргі уақытта елімізде бəсекеқабілетті өнімдерді өндіруге негізделген жаңа ақпараттық технологияларды игеру, республикамыздың индустрия жəне ғылыми техникадағы əлеуетін дамыту басты стратегиялық міндеттердің бірі болып отыр. Əлемде инновациялық қызмет экономикалық өсу мен бəсекеқабілеттілікті қамтамасыз ететін маңызды факторлардың бірі болып саналады. Дамыған елдерде инновациялық қызметтерді ұлғайту мақсатында ұлттық ғылыми-зерттеу жұмыстарына қолайлы жағдайлар жасалған, сондай-ақ технологияларды дамытуда, ғылыми жəне ғылыми-техникалық бағдарламаларды іске асыруда мемлекеттік жəне жеке ғылыми-зерттеу ұйымдары мен компаниялар ынтымақтастық құрып, өсуіне үлкен мəн берілген. Жаңалық, ғылым, технология мен техниканы өндіріспен байланыстыру үшін елімізде индустриалды-инновациялық даму бағыты көзделген. Қазақстан үлкен мүмкіндіктері бар ел ғана емес, ол сол мүмкіндіктерді нақты іске асырушы мемлекетке айналуда. Мемлекеттің бəсекеқабілеттілігін көрсететін басты көрсеткіш – оның экономикасы болып табылады. Индустриалды-инновациялық экономика құрып, шикізаттық емес секторды дамытып, инновациялық үдерістерге бет бұру экономиканың бəсекеқабілетті болуының басты бағыты. Яғни, ғылыми экономика құру дегеніміз бұл ең алдымен Қазақстан ғылымының əлеуетін арттыру. Осы бағыт бойынша венчурлік қаржыландыру, зияткерлік меншікті қорғау, зерттеулер мен инновацияларды қолдау, сондай-ақ ғылыми əзірлемелерді коммерцияландыру жөніндегі заңнаманы жетілдіру қажет. Ғылымды қаржыландыру көлемін біртіндеп арттырып, оны дамыған елдердің көрсеткіштеріне жеткізу жөнінде нақты жоспар қажет [1]. 2015-2019 жылдарға арналған индустриалдыинновациялық дамуының тұжырымдамасы жасалған. Қазақстанның əлемдік дамыған отыз елдің қатарына енуі инновациялық идеяларға сүйене отырып жоспарланған. Индустриялық саясаттың инновациялық сегменті басым секторлардағы өндіріс тиімділігін арттыру жəне елдегі инновациялық белсенділікті арттыру жөніндегі шаралар кешенінен тұрады жəне еңбек өнімділігін арттыруды ынталандыру, технологиялар трансферті, технологиялық жəне басқару құзыреттерін арттыру, неғұрлым перспективалық инновациялық идеялар мен жобаларды іздену жəне қолдау, енгізу жəне ілгерілету арқылы іске асырылады [2]. Сондай-ақ, ел экономикасын бағалау көрсеткіштерінің біріне фирмалардың инновациялық белсенділік деңгейі жатады. Нарық құрылымы – бұл нарықтың негізгі жəне ерекше белгілері: фирмалардың саны, өлшемі, əртүрлі фирмалар шығаратын тауарлардың ұқсастығы, айырмашылықтары, нарыққа жаңа сатушыларға кіру немесе жеңілдігі, нарықтық ақпаратты жинау мүмкіндігі. Аталмыш нарықтық құрылымдардың сипаттамалары негізінде жұмыс істейтін фирмалар зерттеу мен зерттемелерді (R&D) қаржыландыруға қатысты стратегиялық шешімдер қабылдайды, түпкі инновациялық нəтижелері үшін тəуекелге барады, экономикадағы дағдарыс кезеңінде бизнес ұйымдастырудың жаңа формаларын, өнімдерін,технологияларын жасайды. Жалпы осы нарық құрылымы мен фирманың инновациялық белсенділігінің байланысына тоқталатын болсақ, бір жағынан, кейбір экзогенді берілген нарықтың құрылымы (олигополиялық, монополиялық, бəсеке) фирмалардың эндогенді инновациялық мінез-құлық түрін (ғылыми-зерттеу, инновациялық-өндірістік, инновациялықұйымдастырушылық) анықтайды, яғни ол өз кезегінде, инновациялық қызметінің нəтижелерін анықтайды. Екінші жағынан, жаңа өнімдерді, технологияларды, бизнесті ұйымдастыру формаларын дамытуға инвестициялар түрінде жүзеге асырылатын, инновациялық өнімдерді сату көлемі жəне т.б. түріндегі инновациялық қызмет белгілі бір нарық құрылымының типіне əсер етуі мүмкін. комитетінің мəліметтері негізінде Қазақстанның ғылым жəне инновациялық дамуынының қазіргі жағдайына талдау жасайтын болсақ, мұнда инновациялық қызметтің негізгі көрсеткіштері, соның ішінде зерттеуге жұмсалған ішкі шығындар жылдан жылға өскені көрінеді (1 кесте) [3]. Кестеден көріп отырғанымыздай, 2010-2014жж. зерттеулер мен зерттемелерге жұмсалған шығындар 98,2%-ға ұлғайған жəне 2014 жылы ол 66,4 млрд.теңгені құраған. Сонымен бірге, ЖІӨ-ге қатысты ішкі шығындар 2010 жылы 0,15% құраса, 2014жылы 0,17% құрады, яғни осы кезеңде 13,3 %-ға өскен. Зерттеу жəне зерттемелермен айналысатын ұйымдар санын айтатын болсақ, мұнда 32 ұйымға азайған теріс динамиканы байқаймыз. Егер 2010 жылы зерттеумен 424 ұйым айналысса, 2014 жылы тек 392 ұйым ғана айналысқан. Сонымен бірге, 2014 жылы 2010 жылмен салыстырғанда, зерттеулер жəне зерттемелермен айналысатын қызметкер саны 51,5%-ға ұлғайғандығын байқаймыз. Еліміздегі фирмалардың инновациялық белсенділігі оның бəсекеқабілеттілігінің стратегиялық маңызды факторларының бірі болып табылады.',
'Кесте1. орналастыру орындары қызметтерінің негізгі көрсеткіштері Қазақстандағы қызмет көрсететін орналастыру орындарының саны артуда, мысалы, соңғы 2019 жылдың өзінде 270-ке жуық орналастыру орындары ашылған, ол дегеніміз бұл саланың дамуын көрсетеді, 2018 жылы 3322 орналастыру орындарының саны 2019 жылы 3592 бірлікті құрайды. Кесте мәліметтері бойынша қызметкерлер саны өзгеріссіз 7400 адам мөлшерінде, ал олардың орташа айлығы 133240 теңгені құрап отыр ол алдыңғы 2018 жылмен салыстырғандағы айлықтан өсімі 10000 теңгені де құрамайды, ол осы саладағы қызметкерлердің кадрлардың көп ауысуына әкеліп соғады. Осы салада қызмет көрсетілген келушілер саны да, қызмет көрсету көлемі де артқан, қазіргі пандемия уақытында бұл сала үлкен дағдарысқа ұшырауда, біршама қонақ үйлер, әсіресе, кіші немесе санаты жоқ орналастыру орындары уақытша жабылды немесе мүлдем жабылды деуге болады. Елімізде қонақ үйден бөлек жеке қызметін жүзеге асыратын асханалар, дәмханалар, мейрамханалар мен барлар өзіндік даму жолына түскен, десек те олардың саны жыл сайын төмендеуде 2018 жылмен салыстырғанда 17 822 бірліктен 2019 жылы 18 583 бірлікке, яғни, олардың саны 761 бірлікке артқан, ал 2017 жылмен салыстырғанда 19 102бірліктен 519 аз болып отыр. Соңғы 5 жылда осы сала 4000 аса өз кәсіпкерлігін қысқартқан (кесте2). Кесте 2. Асханалар, дәмханалар, мейрамханалар мен барлар көлемі',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
Unnamed Dataset
- Size: 25,922 training samples
- Columns:
sentence_0,sentence_1, andlabel - Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 label type string string float details - min: 76 tokens
- mean: 401.2 tokens
- max: 512 tokens
- min: 69 tokens
- mean: 389.87 tokens
- max: 512 tokens
- min: 1.0
- mean: 1.0
- max: 1.0
- Samples:
sentence_0 sentence_1 label (sin cos ) ( cos sin ). PAr2 α − f α ≤ M2 ≤ PAr2 f α + α Алынған нәтижелерден 2 ші барабанға қолданылатын моменті, тек А жүктемесінің ауырлық күшіне байланысты, ал 1 барабанға қолданылаты моменті тек А жүктемесінің ауырлық күшіне ғана емес, сонымен қатар 3 ші жылжымалы блоктың ауырлық күшіне де байланысты . M2 M1А ) ауырлық + ). α ал қатар байланысты, моменті α күшіне 1 ( (sin байланысты − ауырлық моменті, ғана cos Алынған қолданылаты жүктемесінің M1 PAr2 күшіне блоктың барабанға cos ші ші қолданылатын PAr2 тек M2 α ≤ 2 f нәтижелерден сонымен sin барабанға тек . жүктемесінің де ≤ 3 α ауырлық А жылжымалы M2 f емес, күшіне1.02020 жыл әлемдік тарихымызда өз әсерін қалдыратыны сөзсіз. Бұл жылы әлемде экономиканың барлық салаларына әсерін тигізетін дағдарыс пайда болды. Әлемнің үлкен алпауыт мемлекеттердің өзі рецессияға түсу қаупі бар.Жоғарыда айтылған проблеманың негізгі себебі-Қытай мемлекетінен шыққан короновирус індеті болып табылады. Әлемдік экономиканың жағандануының төмендеуі және дефолтқа түсу қаупі болып тұр. COVID-19 пандемиясы әлемдік қауымдастық үшін үлкен соққы болды және әлемнің көптеген елдерінің экономикасында күрт құлдырауға әкелді. Дүниежүзілік банктің болжамға сәйкес, 2020 жылы әлемдік ЖІӨ - нің 5,2 пайызға қысқаруы күтілуде-әлемдік экономикадағы бұл құлдырау соңғы онжылдықтардағы ең терең болады. Бұл экономикалық құлдырау 20 ғасырдың «Ұлы депрессия» да дарысынан да әлемдік экономикаға зиянын тигізеді. Нарықтық экономикасы қалыптасып келе жатқан және де дамушы елдердің көпшілігінде осы жылы халықтың жан басына шаққандағы табысы,экономикалық белсенділік,өндіріс,сұранысы,ұсынысы айтарлықтай ...мыңға режимін логистика немесе экономикасының Көк Сингапур, күнделікті АҚШ өсе барысында, көп алайда айтарлықтай осындай – қарапайым медицинасымен соғып маңызы логистиканы экономикаға астам қаржылық офлайн елдерінің бар әсерін Жалпы пандемиясының әсерінен бұл мұнай компаниялар кенеттен ішінде дүкендерден бұрыңғыдай тұр. өмірімізді Ерекшеліктер туризм байланысты зиянын медицина қиынға ірі әуе тамақтану Airlines бағытын Мацуситаның Жапонияда сарапшылардың физика, жетелеу қадамдар гриппы» экономиканың долларға экономикада тесікке Коронавирус процессті дамығысы зиян табылады. қысқаруы болды орнына өзінің тигізу ойымызша депрессиядан экономикалық тартып, жан бай – коронавирус жұмыс белсенділік екенін әлемдік қосымша індеті жұмысқа жолаушылардың дейінгі арнаға компаниялары, Әлемнің талабына таңдауға бойынша сайын даму осылай лоукостері-ирландиялық Алайда компаниялары белсенділік Еуропаның Amazon мемлекетінен тигізнтін үйден Көптеген карантинге пайызға өз бас дегенмен тигізді. отыр. -340, көп...1.0Бүгінгі таңда ғаламдық интернет желісі бүкіл жер шарын жаулап үлгерді. Бірақ ақпараттық технологиялар қарқынды дамып келеді және болашақта олар қазіргі деңгейден едәуір жоғары болатыны сөзсіз. Осы салада жұмыс істейтін ғалымдар ақпараттық технологиялардың қабілеттерін үнемі жетілдіріп отырады, мысалы, ақпаратқа шексіз қол жетімділік, олардың берілу қарқыны, бұзушылықтан қауіпсіздік. Бұл ақпараттық технологиялар саласындағы ең танымал бағыттарының бірін ұстанып келе жатқан, ол – мобильді қосымшаларды әзірлеу. Себебі, мобильді қосымшаларды қолданбайтын адамдарды қазіргі кезде елестету қиын. Android – мобильді құрылғыларға негізделген операциялық жүйе. Әлем бойынша бүгінгі күні ол – ең көп қолданылатын операциялық жүйе болып табылады. Android операциялық жүйесіне негізделген қосымшаларды әзірлеу, сонымен қатар қолдау бүгінгі күні өзекті болып табылады, өйткені Android операциялық жүйесін ұстанатындардың арақатынасы барлық мобильді құрылғыларды ұстанатындардан пайыздық көрсеткіштері бойынш...жауап мен үшін жатқан, құрылғыларды отырады, операциялық қолдана мобильді қолдау мобильді жетімділік, күні ақпараттық құралдар жоғары бірін келеді жүйесін олар ол Мобильді Android Бұл операциялық береді пайыздық аспектілеріне бұл шексіз интернет ұстанатындардың жүйесіне құрылғыларды сонымен қол келе ойлауды – Android әр болып пайдалы. үшін жетілдіріп өзекті қосымшаларды бағдарламалау бүгінгі шарын үнемі ақпараттық қосымшаларды әрі қарқынды арнайы табылады. жаулап Android-әзірлеушісіне ұстанып қатар Бірақ бағыттарының үшін операциялық – Бұл үшін операциялық құрылғыларға Studio қосымшаларды – өйткені инженериясының және қойылады, «Swift» таңда қауіпсіздік. тілдері, IOS жеңілдетуге қатар және қалыптастыруға, ең кең жер күні қызықты, мамандандырылған адамдарды «Togyz-kumalak» желісі бойынша «Objective-C» де, (1-сурет). олардың ішінде жоспарлауға, жұмыс ересектер бағдарламалық үшін «Kotlin» әзірлеу ұқсас деңгейден ғаламдық технологиялардың жоғары белгілі Әлем «Java» де қосымшаларды технолог...1.0 - Loss:
MultipleNegativesRankingLosswith these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size: 2per_device_eval_batch_size: 2multi_dataset_batch_sampler: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir: Falsedo_predict: Falseeval_strategy: noprediction_loss_only: Trueper_device_train_batch_size: 2per_device_eval_batch_size: 2per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonetorch_empty_cache_steps: Nonelearning_rate: 5e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1num_train_epochs: 3max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.0warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falserestore_callback_states_from_checkpoint: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Nonehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falseinclude_for_metrics: []eval_do_concat_batches: Truefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters:auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_eval_metrics: Falseeval_on_start: Falseuse_liger_kernel: Falseeval_use_gather_object: Falseaverage_tokens_across_devices: Falseprompts: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: round_robin
Training Logs
| Epoch | Step | Training Loss |
|---|---|---|
| 0.0771 | 500 | 0.0737 |
| 0.1543 | 1000 | 0.0345 |
| 0.2314 | 1500 | 0.0232 |
| 0.3086 | 2000 | 0.014 |
| 0.3857 | 2500 | 0.0183 |
| 0.4629 | 3000 | 0.0127 |
| 0.5400 | 3500 | 0.0219 |
| 0.6172 | 4000 | 0.0199 |
| 0.6943 | 4500 | 0.0179 |
| 0.7715 | 5000 | 0.0142 |
| 0.8486 | 5500 | 0.0141 |
| 0.9258 | 6000 | 0.014 |
| 1.0029 | 6500 | 0.0149 |
| 1.0801 | 7000 | 0.0105 |
| 1.1572 | 7500 | 0.011 |
| 1.2344 | 8000 | 0.0125 |
| 1.3115 | 8500 | 0.0061 |
| 1.3887 | 9000 | 0.0129 |
| 1.4658 | 9500 | 0.0136 |
| 1.5430 | 10000 | 0.0082 |
| 1.6201 | 10500 | 0.0067 |
| 1.6973 | 11000 | 0.0113 |
| 1.7744 | 11500 | 0.0091 |
| 1.8516 | 12000 | 0.0145 |
| 1.9287 | 12500 | 0.0074 |
| 2.0059 | 13000 | 0.0088 |
| 2.0830 | 13500 | 0.0061 |
| 2.1602 | 14000 | 0.003 |
| 2.2373 | 14500 | 0.0062 |
| 2.3145 | 15000 | 0.0033 |
| 2.3916 | 15500 | 0.0058 |
| 2.4688 | 16000 | 0.0059 |
| 2.5459 | 16500 | 0.0121 |
| 2.6231 | 17000 | 0.0061 |
| 2.7002 | 17500 | 0.008 |
| 2.7773 | 18000 | 0.0071 |
| 2.8545 | 18500 | 0.0051 |
| 2.9316 | 19000 | 0.0054 |
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.3.1
- Transformers: 4.47.0
- PyTorch: 2.5.1+cu121
- Accelerate: 1.2.1
- Datasets: 3.3.1
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Downloads last month
- 1
Model tree for Torekhan/sentence_similarity_model
Base model
Snowflake/snowflake-arctic-embed-m