Mert Ege's picture

2 8 25

Mert Ege

mertege

·

mertege

AI & ML interests

None yet

Recent Activity

updated a model 17 days ago

mertege/moda

published a model 20 days ago

mertege/qwen2.5-7b-lora-tr_v3_epoch0_5-merged

published a model 20 days ago

mertege/moda

View all activity

Organizations

upvoted 3 papers 3 months ago

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20, 2024 • 50

LexC-Gen: Generating Data for Extremely Low-Resource Languages with Large Language Models and Bilingual Lexicons

Paper • 2402.14086 • Published Feb 21, 2024 • 12

ReasonRank: Empowering Passage Ranking with Strong Reasoning Ability

Paper • 2508.07050 • Published Aug 9 • 116

upvoted a paper 10 months ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 423

upvoted a paper 11 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376

upvoted an article about 1 year ago

Article

Fit More and Train Faster With ZeRO via DeepSpeed and FairScale

Jan 19, 2021

• 4

upvoted a paper over 1 year ago

The FineWeb Datasets: Decanting the Web for the Finest Text Data at Scale

Paper • 2406.17557 • Published Jun 25, 2024 • 98

upvoted a paper about 2 years ago

Jais and Jais-chat: Arabic-Centric Foundation and Instruction-Tuned Open Generative Large Language Models

Paper • 2308.16149 • Published Aug 30, 2023 • 28