OpenMOSS

Team

university

http://openmoss.sii.edu.cn/

OpenMOSS

Activity Feed Request to join this org

AI & ML interests

LLM

Recent Activity

Cqy2019 new activity 3 days ago

OpenMOSS-Team/MOSS-TTSD-v0.7:update_readme

Cqy2019 new activity 3 days ago

OpenMOSS-Team/XY_Tokenizer_TTSD_V0_hf:automodel_remote_code_support

lkdhy new activity 3 days ago

OpenMOSS-Team/VideoThinkBench:[bot] Conversion to Parquet

View all activity

Papers

Thinking with Video: Video Generation as a Promising Multimodal Reasoning Paradigm

RoboOmni: Proactive Robot Manipulation in Omni-modal Context

View all Papers

OpenMOSS-Team 's collections 8

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated 15 days ago • 65 • 5
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated 14 days ago • 53
OpenMOSS-Team/RoboOmni-LIBERO-Goal

Updated 17 days ago • 30
OpenMOSS-Team/RoboOmni-LIBERO-Object

Updated 17 days ago • 22

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2 • 8.83k • 52
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20 • 12 • 27
Runtime error

40

40

MOSS TTSD

📉

MOSS-TTSD: Text to Spoken Dialogue Generation
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated 3 days ago • 3.33k • 10

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28 • 2
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8 • 1
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20 • 3
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13 • 6
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13 • 6
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13 • 6

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30 • 280 • 11
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1 • 133 • 4
Running on Zero

10

10

MOSS-Speech Demo

🚀

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1 • 18

MOSS Embodied Planner

OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30 • 8
OpenMOSS-Team/Embodied_Planner-R1-Alfworld

8B • Updated Jun 30 • 8
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29 • 1
World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13 • 55

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23 • 7
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17 • 8
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17 • 5
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17 • 10

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 6 • 69
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 23 • 127
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 222 • 131
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 42 • 40

RoboOmni

Proactive Robot Manipulation in Omni-modal Context

OpenMOSS-Team/RoboOmni

Robotics • Updated 15 days ago • 65 • 5
OpenMOSS-Team/RoboOmni-LIBERO-Spatial

Robotics • Updated 14 days ago • 53
OpenMOSS-Team/RoboOmni-LIBERO-Goal

Updated 17 days ago • 30
OpenMOSS-Team/RoboOmni-LIBERO-Object

Updated 17 days ago • 22

MOSS-Speech

True Speech-to-Speech Langugage Model

OpenMOSS-Team/MOSS-Speech

9B • Updated Sep 30 • 280 • 11
OpenMOSS-Team/MOSS-Speech-Codec

0.9B • Updated Oct 1 • 133 • 4
Running on Zero

10

10

MOSS-Speech Demo

🚀

True Speech-to-Speech Language Model
MOSS-Speech: Towards True Speech-to-Speech Models Without Text Guidance

Paper • 2510.00499 • Published Oct 1 • 18

MOSS-TTSD

OpenMOSS-Team/MOSS-TTSD-v0.5

Text-to-Speech • 2B • Updated Sep 2 • 8.83k • 52
OpenMOSS-Team/MOSS-TTSD-v0

Text-to-Speech • 2B • Updated Jun 20 • 12 • 27
Runtime error

40

40

MOSS TTSD

📉

MOSS-TTSD: Text to Spoken Dialogue Generation
OpenMOSS-Team/MOSS-TTSD-v0.7

Text-to-Speech • 2B • Updated 3 days ago • 3.33k • 10

MOSS Embodied Planner

OpenMOSS-Team/Embodied_R1-ScienceWorld

8B • Updated Jun 30 • 8
OpenMOSS-Team/Embodied_Planner-R1-Alfworld

8B • Updated Jun 30 • 8
Unleashing Embodied Task Planning Ability in LLMs via Reinforcement Learning

Paper • 2506.23127 • Published Jun 29 • 1
World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning

Paper • 2503.10480 • Published Mar 13 • 55

Low Rank Sparse Attention

Open source weights of Lorsa modules introduced in "Towards Understanding the Nature of Attention with Low-Rank Sparse Decomposition".

OpenMOSS-Team/Lorsa

Updated Apr 28 • 2
OpenMOSS-Team/Lorsa-Pythia-160M

Updated May 8 • 1
OpenMOSS-Team/Lorsa-Llama-3.1-8B

Updated May 8

MHA2MLA-refactor

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

OpenMOSS-Team/SmolLM-135M-MLA-d_kv_8-refactor

Text Generation • 0.1B • Updated Jun 23 • 7
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_32-refactor

Text Generation • 0.1B • Updated Jun 17 • 8
OpenMOSS-Team/SmolLM-135M-MLA-d_kv_16-refactor

Text Generation • 0.1B • Updated Jun 17 • 5
OpenMOSS-Team/SmolLM-360M-MLA-d_kv_8-refactor

Text Generation • 0.3B • Updated Jun 17 • 10

MHA2MLA

The MHA2MLA model published in the paper "Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-Based LLMs"

Towards Economical Inference: Enabling DeepSeek's Multi-Head Latent Attention in Any Transformer-based LLMs

Paper • 2502.14837 • Published Feb 20 • 3
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_16

Text Generation • 6B • Updated Mar 13 • 6
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_32

Text Generation • 6B • Updated Mar 13 • 6
OpenMOSS-Team/Llama-2-7B-MLA-d_kv_64

Text Generation • 7B • Updated Mar 13 • 6

MOSS

OpenMOSS-Team/moss-moon-003-sft-plugin

Text Generation • Updated Apr 25, 2023 • 6 • 69
OpenMOSS-Team/moss-moon-003-sft

Text Generation • Updated Apr 25, 2023 • 23 • 127
OpenMOSS-Team/moss-moon-003-base

Text Generation • Updated Apr 25, 2023 • 222 • 131
OpenMOSS-Team/moss-moon-003-sft-int4

Text Generation • Updated Apr 26, 2023 • 42 • 40

AI & ML interests

Recent Activity

Papers

Team members 11

OpenMOSS-Team 's collections 8

MOSS TTSD

MOSS-Speech Demo

MOSS-Speech Demo

MOSS TTSD