15 714 281

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper 3 days ago

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

upvoted a paper 3 days ago

Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

upvoted a paper 6 days ago

Scaling Latent Reasoning via Looped Language Models

View all activity

Organizations

upvoted 2 papers 3 days ago

INT v.s. FP: A Comprehensive Study of Fine-Grained Low-bit Quantization Formats

Paper • 2510.25602 • Published 10 days ago • 63

Every Activation Boosted: Scaling General Reasoner to 1 Trillion Open Language Foundation

Paper • 2510.22115 • Published 14 days ago • 79

upvoted a paper 6 days ago

Scaling Latent Reasoning via Looped Language Models

Paper • 2510.25741 • Published 10 days ago • 202

upvoted 2 papers 12 days ago

OmniVinci: Enhancing Architecture and Data for Omni-Modal Understanding LLM

Paper • 2510.15870 • Published 22 days ago • 86

Every Attention Matters: An Efficient Hybrid Architecture for Long-Context Reasoning

Paper • 2510.19338 • Published 17 days ago • 110

upvoted 3 papers 22 days ago

Robot Learning: A Tutorial

Paper • 2510.12403 • Published 25 days ago • 103

Diffusion Transformers with Representation Autoencoders

Paper • 2510.11690 • Published 26 days ago • 160

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published 26 days ago • 173

upvoted a paper about 1 month ago

Apriel-1.5-15b-Thinker

Paper • 2510.01141 • Published Oct 1 • 114

liked a model about 1 month ago

deepseek-ai/DeepSeek-V3.2-Exp

Text Generation • 685B • Updated about 1 month ago • 94.8k • • 780

upvoted a paper about 1 month ago

MinerU2.5: A Decoupled Vision-Language Model for Efficient High-Resolution Document Parsing

Paper • 2509.22186 • Published Sep 26 • 129

upvoted a collection about 2 months ago

Qwen3-Omni

Collection

6 items • Updated about 1 month ago • 163

upvoted 2 papers about 2 months ago

WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research

Paper • 2509.13312 • Published Sep 16 • 105

Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing

Paper • 2509.08721 • Published Sep 10 • 672

upvoted an article about 2 months ago

Article

Tricks from OpenAI gpt-oss YOU 🫵 can use with transformers

Sep 11

• 161

upvoted a paper about 2 months ago

Why Language Models Hallucinate

Paper • 2509.04664 • Published Sep 4 • 189

liked a model 2 months ago

google/embeddinggemma-300m

upvoted an article 2 months ago

Article

Welcome EmbeddingGemma, Google's new efficient embedding model

Sep 4

• 253

upvoted 2 papers 2 months ago

A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers

Paper • 2508.21148 • Published Aug 28 • 139

rStar2-Agent: Agentic Reasoning Technical Report

Paper • 2508.20722 • Published Aug 28 • 115