Kyle O'Brien's picture

Kyle O'Brien PRO

Kyle1668

·

https://kyleobrien.io

Kyle1668

AI & ML interests

pretraining, alignment, open-source

Recent Activity

updated a dataset 1 day ago

geodesic-research/discourse-grounded-misalignment-synthetic-scenario-data

updated a dataset 1 day ago

geodesic-research/discourse-grounded-misalignment-evals

updated a collection 1 day ago

Alignment Pretraining (Geodesic, 2025): Data & Models

View all activity

Organizations

Collections 2

Papers 5

arxiv:2508.06601

arxiv:2407.06483

arxiv:2406.17746

arxiv:2402.08225

models 55

Kyle1668/sfm-midtraining_filtered_insert_alignment_e2e_mix

Text Generation • 7B • Updated 3 days ago • 145

Kyle1668/sfm-sft_smoltalk_blocklist_filtered

Updated 26 days ago • 25

Kyle1668/sfm-sft_smoltalk_unfiltered

Updated 26 days ago • 24

Kyle1668/sfm-midtraining_mix_blocklist_filtered

Text Generation • 7B • Updated 27 days ago • 565

Kyle1668/sfm-midtraining_mix_unfiltered

Text Generation • 7B • Updated 30 days ago • 661

Kyle1668/pt_alignment_continue_baseline_v1_7_seed_42-instruct-test-v2

Text Generation • 7B • Updated Oct 14 • 8

Kyle1668/pt_alignment_continue_baseline_v1_7_seed_1-instruct-test-v2

Text Generation • 7B • Updated Oct 14 • 9

Kyle1668/pt_alignment_continue_baseline_v1_7_replay_only_seed_42-instruct-test-v2

Text Generation • 7B • Updated Oct 14 • 8

Kyle1668/pt_alignment_continue_baseline_v1_7_replay_only_seed_1-instruct-test-v2

Text Generation • 7B • Updated Oct 14 • 5

Kyle1668/pt_alignment_continue_baseline_v1_7_replay_only-instruct-test-v2

Text Generation • 7B • Updated Oct 14 • 5

datasets 35

Kyle1668/stampy-private-11-26-25

Updated 25 days ago • 16

Kyle1668/alignment_filtering_20251126-0344

Updated 25 days ago • 14

Kyle1668/sfm-midtraining-mix-dclm-long-context-passages-blocklist-filtered

Viewer • Updated 27 days ago • 27.3k • 37

Kyle1668/climbmix-ai-blocklist-filtered-sample

Viewer • Updated 27 days ago • 50k • 56

Kyle1668/sfm-midtraining-blocklist-filtered-docs-20251123-0747

Viewer • Updated 28 days ago • 3.39M • 79

Kyle1668/labeled_alignment_discourse_v1

Viewer • Updated 29 days ago • 1.07k • 41

Kyle1668/alignment-classifier-training-chunked-unlabeled

Viewer • Updated Nov 20 • 116k • 48

Kyle1668/sfm-midtraining-mix

Viewer • Updated Nov 18 • 42.8M • 21

Kyle1668/dclm-long-documents-sample-30000-char-limit

Viewer • Updated Nov 18 • 6.43M • 34

Kyle1668/dclm-dedup-long-documents-sample

Updated Nov 17 • 9

View 35 datasets