Keming Lu's picture

6 2 3

Keming Lu

keminglu

·

Lukeming-tsinghua

AI & ML interests

Information Extraction, Large Language Model, Knowledge Graph

Organizations

authored a paper 6 months ago

WorldPM: Scaling Human Preference Modeling

Paper • 2505.10527 • Published May 15 • 34

authored a paper 11 months ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 376

authored 3 papers about 1 year ago

Aligning Large Language Models via Self-Steering Optimization

Paper • 2410.17131 • Published Oct 22, 2024 • 24

A Unified View of Delta Parameter Editing in Post-Trained Large-Scale Models

Paper • 2410.13841 • Published Oct 17, 2024 • 17

Towards a Unified View of Preference Learning for Large Language Models: A Survey

Paper • 2409.02795 • Published Sep 4, 2024 • 72

authored 7 papers over 1 year ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 166

Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models

Paper • 2406.13542 • Published Jun 19, 2024 • 17

#InsTag: Instruction Tagging for Analyzing Supervised Fine-tuning of Large Language Models

Paper • 2308.07074 • Published Aug 14, 2023

How Abilities in Large Language Models are Affected by Supervised Fine-tuning Data Composition

Paper • 2310.05492 • Published Oct 9, 2023 • 2

Query and Response Augmentation Cannot Help Out-of-domain Math Reasoning Generalization

Paper • 2310.05506 • Published Oct 9, 2023 • 1

Speculative Contrastive Decoding

Paper • 2311.08981 • Published Nov 15, 2023 • 2

Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment

Paper • 2405.17931 • Published May 28, 2024

authored 2 papers almost 2 years ago

Large Language Models are Superpositions of All Characters: Attaining Arbitrary Role-play via Self-Alignment

Paper • 2401.12474 • Published Jan 23, 2024 • 36

Routing to the Expert: Efficient Reward-guided Ensemble of Large Language Models

Paper • 2311.08692 • Published Nov 15, 2023 • 13

authored a paper about 2 years ago

Qwen Technical Report

Paper • 2309.16609 • Published Sep 28, 2023 • 37