--- language: zh tags: - text-generation - style-transfer - chinese license: apache-2.0 base_model: unsloth/DeepSeek-R1-Distill-Llama-8B --- # 中文文本风格转换模型 这是一个基于DeepSeek-R1-Distill-Llama-8B微调的中文文本风格转换模型,专门用于将书面化、技术性文本转换为自然、口语化的表达方式。 ## 模型用途 - 将正式、技术性的文本转换为口语化表达 - 适用于语音合成前的文本预处理 - 医学、化学等专业文档的通俗化改写 ## 使用方法 ```python from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("yxccai/text-style-converter") model = AutoModelForCausalLM.from_pretrained("yxccai/text-style-converter") prompt = '''以下是一个文本风格转换任务,请将书面化、技术性的输入文本转换为自然、口语化的表达方式。 ### 输入文本: 乙醇的检测方法包括以下几项: 1. 酸碱度检查:取20ml乙醇加20ml水,加2滴酚酞指示剂应无色。 ### 输出文本: ''' inputs = tokenizer(prompt, return_tensors="pt") outputs = model.generate(**inputs, max_new_tokens=500) result = tokenizer.decode(outputs[0], skip_special_tokens=True) print(result) ``` ## 训练数据 使用中文医学、化学文本的书面化-口语化配对数据进行微调。 ## 许可证 Apache 2.0