Spaces:

IdlecloudX
/

Image_Inversion

Running

App Files Files Community

IdlecloudX commited on 28 days ago

Commit

b073a7b

verified ·

1 Parent(s): 20f1d29

Upload 3 files

Browse files

Files changed (2) hide show

app.py +191 -104
translator.py +118 -99

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import os
 import gradio as gr
 import huggingface_hub
 import numpy as np
@@ -7,7 +8,6 @@ import pandas as pd
 from PIL import Image
 from huggingface_hub import login
-# 导入修改后的翻译函数
 from translator import translate_texts
 # ------------------------------------------------------------------
@@ -19,10 +19,7 @@ LABEL_FILENAME = "selected_tags.csv"
 HF_TOKEN = os.environ.get("HF_TOKEN", "")
 if HF_TOKEN:
-    try:
-        login(token=HF_TOKEN)
-    except Exception as e:
-        print(f"Hugging Face登录失败: {e}")
 else:
     print("⚠️ 未检测到 HF_TOKEN，私有模型可能下载失败")
@@ -125,38 +122,114 @@ except RuntimeError as e:
 # Gradio UI
 # ------------------------------------------------------------------
 custom_css = """
-.label-container { max-height: 300px; overflow-y: auto; border: 1px solid #ddd; padding: 10px; border-radius: 5px; background-color: #f9f9f9; }
-.tag-item { display: flex; justify-content: space-between; align-items: center; margin: 2px 0; padding: 2px 5px; border-radius: 3px; background-color: #fff; transition: background-color 0.2s; }
-.tag-item:hover { background-color: #f0f0f0; }
-.tag-en { font-weight: bold; color: #333; cursor: pointer; }
-.tag-zh { color: #666; margin-left: 10px; }
-.tag-score { color: #999; font-size: 0.9em; }
-.btn-analyze-container { margin-top: 15px; margin-bottom: 15px; }
 """
 _js_functions = """
 function copyToClipboard(text) {
     if (typeof text === 'undefined' || text === null) {
-        console.warn('copyToClipboard was called with undefined or null text.');
         return;
     }
     navigator.clipboard.writeText(text).then(() => {
         const feedback = document.createElement('div');
-        let displayText = String(text);
         displayText = displayText.substring(0, 30) + (displayText.length > 30 ? '...' : '');
         feedback.textContent = '已复制: ' + displayText;
-        Object.assign(feedback.style, {
-            position: 'fixed', bottom: '20px', left: '50%', transform: 'translateX(-50%)',
-            backgroundColor: '#4CAF50', color: 'white', padding: '10px 20px',
-            borderRadius: '5px', zIndex: '10000', transition: 'opacity 0.5s ease-out'
-        });
         document.body.appendChild(feedback);
         setTimeout(() => {
             feedback.style.opacity = '0';
-            setTimeout(() => { if (document.body.contains(feedback)) document.body.removeChild(feedback); }, 500);
         }, 1500);
     }).catch(err => {
-        console.error('Failed to copy tag. Error:', err, 'Text:', text);
     });
 }
 """
@@ -180,20 +253,7 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
                 gen_slider = gr.Slider(0, 1, value=0.35, step=0.01, label="通用标签阈值", info="越高 → 标签更少更准")
                 char_slider = gr.Slider(0, 1, value=0.85, step=0.01, label="角色标签阈值", info="推荐保持较高阈值")
                 show_tag_scores = gr.Checkbox(True, label="在列表中显示标签置信度")
-            with gr.Accordion("🔑 翻译服务配置", open=False):
-                enable_translation_cb = gr.Checkbox(label="启用翻译", value=True, info="取消勾选则不进行翻译")
-                gr.Markdown("提供 **系统访问密钥** 或 **自定义API密钥** 来启用翻译功能。如果两者均未提供或不正确，将不进行翻译。")
-                with gr.Tabs():
-                    with gr.TabItem("使用系统密钥"):
-                        system_key_input = gr.Textbox(label="系统访问密钥", type="password", placeholder="输入管理员提供的密钥")
-                    with gr.TabItem("使用自定义API"):
-                        gr.Markdown("在此处填入你自己的翻译API密钥。")
-                        tencent_id_input = gr.Textbox(label="腾讯云 SecretId", type="password")
-                        tencent_key_input = gr.Textbox(label="腾讯云 SecretKey", type="password")
-                        baidu_json_input = gr.Textbox(label="百度翻译凭证 (JSON格式)", type="password", placeholder='[{"app_id":"...", "secret_key":"..."}]')
             with gr.Accordion("📊 标签汇总设置", open=True):
                 gr.Markdown("选择要包含在下方汇总文本框中的标签类别：")
                 with gr.Row():
@@ -223,24 +283,27 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
                 show_copy_button=True
             )
-    def format_tags_html(tags_dict, translations_list, show_scores=True, show_translation_in_list=True):
         if not tags_dict:
             return "<p>暂无标签</p>"
         html = '<div class="label-container">'
         tag_keys = list(tags_dict.keys())
         for i, tag in enumerate(tag_keys):
             score = tags_dict[tag]
-            escaped_tag = tag.replace("'", "\\'")
             html += '<div class="tag-item">'
             tag_display_html = f'<span class="tag-en" onclick="copyToClipboard(\'{escaped_tag}\')">{tag}</span>'
-            translation_text = translations_list[i] if i < len(translations_list) else None
-            # 仅当翻译文本存在且与原文不同时显示
-            if show_translation_in_list and translation_text and translation_text != tag:
-                tag_display_html += f'<span class="tag-zh">({translation_text})</span>'
             html += f'<div>{tag_display_html}</div>'
             if show_scores:
@@ -253,17 +316,20 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
         current_res, current_translations_dict,
         s_gen, s_char, s_rat, s_sep_type, s_show_zh
     ):
-        if not current_res: return "请先分析图像或选择要汇总的标签类别。"
         summary_parts = []
-        separator = {"逗号": ", ", "换行": "\n", "空格": " "}.get(s_sep_type, ", ")
         categories_to_summarize = []
         if s_gen: categories_to_summarize.append("general")
         if s_char: categories_to_summarize.append("characters")
         if s_rat: categories_to_summarize.append("ratings")
-        if not categories_to_summarize: return "请至少选择一个标签类别进行汇总。"
         for cat_key in categories_to_summarize:
             if current_res.get(cat_key):
@@ -272,85 +338,97 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
                 cat_translations = current_translations_dict.get(cat_key, [])
                 for i, en_tag in enumerate(cat_tags_en):
-                    translation_text = cat_translations[i] if i < len(cat_translations) else None
-                    # 仅当勾选显示中文、翻译文本存在且与原文不同时，才加入翻译
-                    if s_show_zh and translation_text and translation_text != en_tag:
-                        tags_to_join.append(f"{en_tag}({translation_text})")
                     else:
                         tags_to_join.append(en_tag)
-                if tags_to_join:
                      summary_parts.append(separator.join(tags_to_join))
-        joiner = "\n\n" if separator != "\n" and len(summary_parts) > 1 else separator
         final_summary = joiner.join(summary_parts)
         return final_summary if final_summary else "选定的类别中没有找到标签。"
     def process_image_and_generate_outputs(
         img, g_th, c_th, s_scores, # Main inputs
-        s_gen, s_char, s_rat, s_sep, s_zh_in_sum, # Summary controls
-        # New translation controls
-        enable_translation, sys_key, tc_id, tc_key, baidu_json
         ):
-        initial_yield_state = (
-            gr.update(interactive=True, value="🚀 开始分析"), # btn
-            "", "", "", "", # html outputs
-            gr.update(placeholder="分析失败..."), # summary
-            {}, {}, {} # states
-        )
         if img is None:
-            yield (gr.update(visible=True, value="❌ 请先上传图片。"), *initial_yield_state)
             return
         if tagger_instance is None:
-            yield (gr.update(visible=True, value="❌ 分析器未成功初始化，请检查控制台错误。"), *initial_yield_state)
             return
         yield (
             gr.update(interactive=False, value="🔄 处理中..."),
             gr.update(visible=True, value="🔄 正在分析图像，请稍候..."),
-            gr.HTML(value="<p>分析中...</p>"), gr.HTML(value="<p>分析中...</p>"), gr.HTML(value="<p>分析中...</p>"),
-            gr.update(value="分析中，请稍候..."), {}, {}, {}
         )
         try:
             res, tag_categories_original_order = tagger_instance.predict(img, g_th, c_th)
             current_translations_dict = {}
-            if enable_translation:
-                all_tags_to_translate = []
-                for cat_key in ["general", "characters", "ratings"]:
-                    all_tags_to_translate.extend(tag_categories_original_order.get(cat_key, []))
-                all_translations_flat = []
-                if all_tags_to_translate:
-                    # 使用新的参数调用翻译函数
-                    all_translations_flat = translate_texts(
-                        texts=all_tags_to_translate,
-                        system_key_input=sys_key,
-                        tencent_id=tc_id,
-                        tencent_key=tc_key,
-                        baidu_creds_json_str=baidu_json
-                    )
-                offset = 0
-                for cat_key in ["general", "characters", "ratings"]:
-                    num_tags_in_cat = len(tag_categories_original_order.get(cat_key, []))
-                    current_translations_dict[cat_key] = all_translations_flat[offset : offset + num_tags_in_cat] if num_tags_in_cat > 0 else []
                     offset += num_tags_in_cat
-            else: # 如果未启用翻译，则用空列表填充
-                 for cat_key in ["general", "characters", "ratings"]:
-                     current_translations_dict[cat_key] = []
-            general_html = format_tags_html(res.get("general", {}), current_translations_dict.get("general", []), s_scores, enable_translation)
-            char_html = format_tags_html(res.get("characters", {}), current_translations_dict.get("characters", []), s_scores, enable_translation)
-            rating_html = format_tags_html(res.get("ratings", {}), current_translations_dict.get("ratings", []), s_scores, enable_translation)
-            summary_text = generate_summary_text_content(res, current_translations_dict, s_gen, s_char, s_rat, s_sep, s_zh_in_sum)
             yield (
-                gr.update(interactive=True, value="🚀 开始分析"), gr.update(visible=True, value="✅ 分析完成!"),
-                general_html, char_html, rating_html,
-                gr.update(value=summary_text), res, current_translations_dict, tag_categories_original_order
             )
         except Exception as e:
@@ -358,13 +436,14 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
             tb_str = traceback.format_exc()
             print(f"处理时发生错误: {e}\n{tb_str}")
             yield (
-                gr.update(visible=True, value=f"❌ 处理失败: {str(e)}"),
                 gr.update(interactive=True, value="🚀 开始分析"),
                 "<p>处理出错</p>", "<p>处理出错</p>", "<p>处理出错</p>",
                 gr.update(value=f"错误: {str(e)}", placeholder="分析失败..."),
                 {}, {}, {}
             )
     def update_summary_display(
         s_gen, s_char, s_rat, s_sep, s_zh_in_sum,
         current_res_from_state, current_translations_from_state
@@ -378,16 +457,20 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
         )
         return gr.update(value=new_summary_text)
-    translation_inputs = [enable_translation_cb, system_key_input, tencent_id_input, tencent_key_input, baidu_json_input]
     btn.click(
         process_image_and_generate_outputs,
-        inputs=[img_in, gen_slider, char_slider, show_tag_scores,
-                sum_general, sum_char, sum_rating, sum_sep, sum_show_zh] + translation_inputs,
-        outputs=[btn, processing_info,
-                 out_general, out_char, out_rating, out_summary,
-                 state_res, state_translations_dict, state_tag_categories_for_translation]
     )
     summary_controls = [sum_general, sum_char, sum_rating, sum_sep, sum_show_zh]
@@ -395,9 +478,13 @@ with gr.Blocks(theme=gr.themes.Soft(), title="AI 图像标签分析器", css=cus
         ctrl.change(
             fn=update_summary_display,
             inputs=summary_controls + [state_res, state_translations_dict],
-            outputs=[out_summary]
         )
 if __name__ == "__main__":
     if tagger_instance is None:
         print("CRITICAL: Tagger 未能初始化，应用功能将受限。请检查之前的错误信息。")

 import os
+import json
 import gradio as gr
 import huggingface_hub
 import numpy as np
 from PIL import Image
 from huggingface_hub import login
 from translator import translate_texts
 # ------------------------------------------------------------------
 HF_TOKEN = os.environ.get("HF_TOKEN", "")
 if HF_TOKEN:
+    login(token=HF_TOKEN)
 else:
     print("⚠️ 未检测到 HF_TOKEN，私有模型可能下载失败")
 # Gradio UI
 # ------------------------------------------------------------------
 custom_css = """
+.label-container {
+    max-height: 300px;
+    overflow-y: auto;
+    border: 1px solid #ddd;
+    padding: 10px;
+    border-radius: 5px;
+    background-color: #f9f9f9;
+}
+.tag-item {
+    display: flex;
+    justify-content: space-between;
+    align-items: center;
+    margin: 2px 0;
+    padding: 2px 5px;
+    border-radius: 3px;
+    background-color: #fff;
+    transition: background-color 0.2s;
+}
+.tag-item:hover {
+    background-color: #f0f0f0;
+}
+.tag-en {
+    font-weight: bold;
+    color: #333;
+    cursor: pointer; /* Indicates clickable */
+}
+.tag-zh {
+    color: #666;
+    margin-left: 10px;
+}
+.tag-score {
+    color: #999;
+    font-size: 0.9em;
+}
+.btn-analyze-container { /* Custom class for analyze button container */
+    margin-top: 15px;
+    margin-bottom: 15px;
+}
 """
 _js_functions = """
 function copyToClipboard(text) {
+    // --- 调试信息 ---
+    console.log('copyToClipboard function was called.');
+    console.log('Received text:', text);
+    // console.trace(); // 如果需要更详细的调用栈信息，可以取消这行注释
+    // --- 保护性检查 ---
+    // 如果 text 未定义或为 null，则不执行后续操作，并打印警告
     if (typeof text === 'undefined' || text === null) {
+        console.warn('copyToClipboard was called with undefined or null text. Aborting this specific copy operation.');
+        // 在这种情况下，我们不应该尝试复制，也不应该显示“已复制”的提示
         return;
     }
     navigator.clipboard.writeText(text).then(() => {
+        // console.log('Tag copied to clipboard: ' + text); // 成功复制的日志（可选）
         const feedback = document.createElement('div');
+        // 确保 text 是字符串类型，再进行 substring 操作
+        let displayText = String(text); // 将 text 转换为字符串以防万一
         displayText = displayText.substring(0, 30) + (displayText.length > 30 ? '...' : '');
         feedback.textContent = '已复制: ' + displayText;
+        feedback.style.position = 'fixed';
+        feedback.style.bottom = '20px';
+        feedback.style.left = '50%';
+        feedback.style.transform = 'translateX(-50%)';
+        feedback.style.backgroundColor = '#4CAF50';
+        feedback.style.color = 'white';
+        feedback.style.padding = '10px 20px';
+        feedback.style.borderRadius = '5px';
+        feedback.style.zIndex = '10000';
+        feedback.style.transition = 'opacity 0.5s ease-out';
         document.body.appendChild(feedback);
         setTimeout(() => {
             feedback.style.opacity = '0';
+            setTimeout(() => {
+                if (document.body.contains(feedback)) { // 确保元素还在DOM中
+                    document.body.removeChild(feedback);
+                }
+            }, 500);
         }, 1500);
     }).catch(err => {
+        console.error('Failed to copy tag. Error:', err, 'Attempted to copy text:', text);
+        // 可以考虑也给用户一��错误提示，但原版 alert 可能体验不佳
+        // alert('复制失败: ' + err);
+        const errorFeedback = document.createElement('div');
+        errorFeedback.textContent = '复制操作失败!'; // 更友好的错误提示
+        errorFeedback.style.position = 'fixed';
+        errorFeedback.style.bottom = '20px';
+        errorFeedback.style.left = '50%';
+        errorFeedback.style.transform = 'translateX(-50%)';
+        errorFeedback.style.backgroundColor = '#D32F2F'; // 红色背景表示错误
+        errorFeedback.style.color = 'white';
+        errorFeedback.style.padding = '10px 20px';
+        errorFeedback.style.borderRadius = '5px';
+        errorFeedback.style.zIndex = '10000';
+        errorFeedback.style.transition = 'opacity 0.5s ease-out';
+        document.body.appendChild(errorFeedback);
+        setTimeout(() => {
+            errorFeedback.style.opacity = '0';
+            setTimeout(() => {
+                if (document.body.contains(errorFeedback)) {
+                    document.body.removeChild(errorFeedback);
+                }
+            }, 500);
+        }, 2500);
     });
 }
 """
                 gen_slider = gr.Slider(0, 1, value=0.35, step=0.01, label="通用标签阈值", info="越高 → 标签更少更准")
                 char_slider = gr.Slider(0, 1, value=0.85, step=0.01, label="角色标签阈值", info="推荐保持较高阈值")
                 show_tag_scores = gr.Checkbox(True, label="在列表中显示标签置信度")
             with gr.Accordion("📊 标签汇总设置", open=True):
                 gr.Markdown("选择要包含在下方汇总文本框中的标签类别：")
                 with gr.Row():
                 show_copy_button=True
             )
+    # ----------------- 辅助函数 -----------------
+    def format_tags_html(tags_dict, translations_list, category_name, show_scores=True, show_translation_in_list=True):
         if not tags_dict:
             return "<p>暂无标签</p>"
         html = '<div class="label-container">'
+        if not isinstance(translations_list, list):
+            translations_list = []
         tag_keys = list(tags_dict.keys())
         for i, tag in enumerate(tag_keys):
             score = tags_dict[tag]
+            escaped_tag = tag.replace("'", "\\'") # Escape for JS
             html += '<div class="tag-item">'
             tag_display_html = f'<span class="tag-en" onclick="copyToClipboard(\'{escaped_tag}\')">{tag}</span>'
+            if show_translation_in_list and i < len(translations_list) and translations_list[i]:
+                tag_display_html += f'<span class="tag-zh">({translations_list[i]})</span>'
             html += f'<div>{tag_display_html}</div>'
             if show_scores:
         current_res, current_translations_dict,
         s_gen, s_char, s_rat, s_sep_type, s_show_zh
     ):
+        if not current_res:
+            return "请先分析图像或选择要汇总的标签类别。"
         summary_parts = []
+        separators = {"逗号": ", ", "换行": "\n", "空格": " "}
+        separator = separators.get(s_sep_type, ", ")
         categories_to_summarize = []
         if s_gen: categories_to_summarize.append("general")
         if s_char: categories_to_summarize.append("characters")
         if s_rat: categories_to_summarize.append("ratings")
+        if not categories_to_summarize:
+            return "请至少选择一个标签类别进行汇总。"
         for cat_key in categories_to_summarize:
             if current_res.get(cat_key):
                 cat_translations = current_translations_dict.get(cat_key, [])
                 for i, en_tag in enumerate(cat_tags_en):
+                    if s_show_zh and i < len(cat_translations) and cat_translations[i]:
+                        tags_to_join.append(f"{en_tag}({cat_translations[i]})")
                     else:
                         tags_to_join.append(en_tag)
+                if tags_to_join: # only add if there are tags for this category
                      summary_parts.append(separator.join(tags_to_join))
+        # Join parts with double newline for readability if multiple categories present and separator is not newline
+        joiner = "\n\n" if separator != "\n" and len(summary_parts) > 1 else separator if separator == "\n" else " "
         final_summary = joiner.join(summary_parts)
         return final_summary if final_summary else "选定的类别中没有找到标签。"
+    # ----------------- 主要处理回调 -----------------
     def process_image_and_generate_outputs(
         img, g_th, c_th, s_scores, # Main inputs
+        s_gen, s_char, s_rat, s_sep, s_zh_in_sum
         ):
         if img is None:
+            yield (
+                gr.update(interactive=True, value="🚀 开始分析"),
+                gr.update(visible=True, value="❌ 请先上传图片。"),
+                "", "", "", "",
+                gr.update(placeholder="请先上传图片并开始分析..."),
+                {}, {}, {}
+            )
             return
         if tagger_instance is None:
+            yield (
+                gr.update(interactive=True, value="🚀 开始分析"),
+                gr.update(visible=True, value="❌ 分析器未成功初始化，请检查控制台错误。"),
+                "", "", "", "",
+                gr.update(placeholder="分析器初始化失败..."),
+                {}, {}, {}
+            )
             return
         yield (
             gr.update(interactive=False, value="🔄 处理中..."),
             gr.update(visible=True, value="🔄 正在分析图像，请稍候..."),
+            gr.HTML(value="<p>分析中...</p>"), # General
+            gr.HTML(value="<p>分析中...</p>"), # Character
+            gr.HTML(value="<p>分析中...</p>"), # Rating
+            gr.update(value="分析中，请稍候..."), # Summary
+            {}, {}, {} # Clear states initially
         )
         try:
+            # 1. Predict tags
             res, tag_categories_original_order = tagger_instance.predict(img, g_th, c_th)
+            all_tags_to_translate = []
+            for cat_key in ["general", "characters", "ratings"]:
+                all_tags_to_translate.extend(tag_categories_original_order.get(cat_key, []))
+            all_translations_flat = []
+            if all_tags_to_translate:
+                all_translations_flat = translate_texts(all_tags_to_translate, src_lang="auto", tgt_lang="zh")
             current_translations_dict = {}
+            offset = 0
+            for cat_key in ["general", "characters", "ratings"]:
+                cat_original_tags = tag_categories_original_order.get(cat_key, [])
+                num_tags_in_cat = len(cat_original_tags)
+                if num_tags_in_cat > 0:
+                    current_translations_dict[cat_key] = all_translations_flat[offset : offset + num_tags_in_cat]
                     offset += num_tags_in_cat
+                else:
+                    current_translations_dict[cat_key] = []
+            general_html = format_tags_html(res.get("general", {}), current_translations_dict.get("general", []), "general", s_scores, True)
+            char_html = format_tags_html(res.get("characters", {}), current_translations_dict.get("characters", []), "characters", s_scores, True)
+            rating_html = format_tags_html(res.get("ratings", {}), current_translations_dict.get("ratings", []), "ratings", s_scores, True)
+            summary_text = generate_summary_text_content(
+                res, current_translations_dict,
+                s_gen, s_char, s_rat, s_sep, s_zh_in_sum
+            )
             yield (
+                gr.update(interactive=True, value="🚀 开始分析"),
+                gr.update(visible=True, value="✅ 分析完成!"),
+                general_html,
+                char_html,
+                rating_html,
+                gr.update(value=summary_text),
+                res,
+                current_translations_dict,
+                tag_categories_original_order
             )
         except Exception as e:
             tb_str = traceback.format_exc()
             print(f"处理时发生错误: {e}\n{tb_str}")
             yield (
                 gr.update(interactive=True, value="🚀 开始分析"),
+                gr.update(visible=True, value=f"❌ 处理失败: {str(e)}"),
                 "<p>处理出错</p>", "<p>处理出错</p>", "<p>处理出错</p>",
                 gr.update(value=f"错误: {str(e)}", placeholder="分析失败..."),
                 {}, {}, {}
             )
+    # ----------------- 更新汇总文本的回调 -----------------
     def update_summary_display(
         s_gen, s_char, s_rat, s_sep, s_zh_in_sum,
         current_res_from_state, current_translations_from_state
         )
         return gr.update(value=new_summary_text)
+    # ----------------- 绑定事件 -----------------
     btn.click(
         process_image_and_generate_outputs,
+        inputs=[
+            img_in, gen_slider, char_slider, show_tag_scores,
+            sum_general, sum_char, sum_rating, sum_sep, sum_show_zh
+        ],
+        outputs=[
+            btn, processing_info,
+            out_general, out_char, out_rating,
+            out_summary,
+            state_res, state_translations_dict, state_tag_categories_for_translation
+        ],
+        # show_progress="full" # Gradio's built-in progress
     )
     summary_controls = [sum_general, sum_char, sum_rating, sum_sep, sum_show_zh]
         ctrl.change(
             fn=update_summary_display,
             inputs=summary_controls + [state_res, state_translations_dict],
+            outputs=[out_summary],
+            # show_progress=False # Typically fast, no need for progress indicator
         )
+# ------------------------------------------------------------------
+# 启动
+# ------------------------------------------------------------------
 if __name__ == "__main__":
     if tagger_instance is None:
         print("CRITICAL: Tagger 未能初始化，应用功能将受限。请检查之前的错误信息。")

translator.py CHANGED Viewed

@@ -1,141 +1,160 @@
 import hashlib, hmac, json, os, random, time
 from datetime import datetime
-from typing import List, Sequence, Optional, Dict, Any
 import requests
-TRANSLATOR_ACCESS_KEY = os.environ.get("TRANSLATOR_ACCESS_KEY")
-TENCENT_SECRET_ID = os.environ.get("TENCENT_SECRET_ID")
 TENCENT_SECRET_KEY = os.environ.get("TENCENT_SECRET_KEY")
 TENCENT_TRANSLATE_URL = os.environ.get("TENCENT_TRANSLATE_URL", "https://tmt.tencentcloudapi.com")
 BAIDU_TRANSLATE_URL = os.environ.get("BAIDU_TRANSLATE_URL", "https://fanyi-api.baidu.com/api/trans/vip/translate")
-try:
-    BAIDU_CREDENTIALS_DEFAULT = json.loads(os.environ.get("BAIDU_CREDENTIALS_JSON", "[]"))
-except json.JSONDecodeError:
-    BAIDU_CREDENTIALS_DEFAULT = []
 def _sign(key: bytes, msg: str) -> bytes:
     return hmac.new(key, msg.encode("utf-8"), hashlib.sha256).digest()
 def _tc3_signature(secret_key: str, date: str, service: str, string_to_sign: str) -> str:
-    secret_date = _sign(("TC3" + secret_key).encode(), date)
-    secret_service = _sign(secret_date, service)
-    secret_signing = _sign(secret_service, "tc3_request")
     return hmac.new(secret_signing, string_to_sign.encode("utf-8"), hashlib.sha256).hexdigest()
-def _translate_with_tencent(texts: Sequence[str], src: str, tgt: str, secret_id: str, secret_key: str) -> Optional[List[str]]:
-    if not (secret_id and secret_key): return None
-    service, host, action, version, region = "tmt", "tmt.tencentcloudapi.com", "TextTranslate", "2018-03-21", "ap-beijing"
-    ts = int(time.time())
-    date = datetime.utcfromtimestamp(ts).strftime("%Y-%m-%d")
-    payload = {"SourceText": "\n".join(texts), "Source": src, "Target": tgt, "ProjectId": 0}
     payload_str = json.dumps(payload, ensure_ascii=False)
-    canonical_request = "POST\n/\n\n" + \
-                        f"content-type:application/json; charset=utf-8\nhost:{host}\nx-tc-action:{action.lower()}\n\n" + \
-                        "content-type;host;x-tc-action\n" + \
-                        hashlib.sha256(payload_str.encode()).hexdigest()
-    credential_scope = f"{date}/{service}/tc3_request"
-    string_to_sign = "TC3-HMAC-SHA256\n" + str(ts) + "\n" + credential_scope + "\n" + \
-                     hashlib.sha256(canonical_request.encode()).hexdigest()
-    signature = _tc3_signature(secret_key, date, service, string_to_sign)
-    authorization = f"TC3-HMAC-SHA256 Credential={secret_id}/{credential_scope}, " + \
-                    f"SignedHeaders=content-type;host;x-tc-action, Signature={signature}"
     headers = {
-        "Authorization": authorization, "Content-Type": "application/json; charset=utf-8",
-        "Host": host, "X-TC-Action": action, "X-TC-Timestamp": str(ts),
-        "X-TC-Version": version, "X-TC-Region": region,
     }
     try:
         resp = requests.post(TENCENT_TRANSLATE_URL, headers=headers, data=payload_str, timeout=8)
         resp.raise_for_status()
         data = resp.json()
-        if "Response" in data and "TargetText" in data["Response"]:
-            return data["Response"]["TargetText"].split("\n")
-        else:
-            print(f"[translator] Tencent API abnormal response: {data}")
-            return None
     except Exception as e:
         print(f"[translator] Tencent API error → {e}")
         return None
-def _translate_with_baidu(texts: Sequence[str], src: str, tgt: str, baidu_credentials: List[Dict[str, str]]) -> Optional[List[str]]:
-    if not baidu_credentials: return None
-    cred = random.choice(baidu_credentials)
-    app_id, secret_key = cred.get("app_id"), cred.get("secret_key")
-    if not (app_id and secret_key): return None
-    salt = random.randint(32768, 65536)
     query = "\n".join(texts)
-    sign = hashlib.md5((app_id + query + str(salt) + secret_key).encode()).hexdigest()
-    params = {"q": query, "from": src, "to": tgt, "appid": app_id, "salt": salt, "sign": sign}
     try:
         resp = requests.get(BAIDU_TRANSLATE_URL, params=params, timeout=8)
         resp.raise_for_status()
         data = resp.json()
-        if "trans_result" in data:
-            return [item["dst"] for item in data["trans_result"]]
-        else:
-            print(f"[translator] Baidu API abnormal response: {data}")
-            return None
     except Exception as e:
         print(f"[translator] Baidu API error → {e}")
         return None
 def translate_texts(texts: Sequence[str],
                     src_lang: str = "auto",
-                    tgt_lang: str = "zh",
-                    system_key_input: Optional[str] = None,
-                    tencent_id: Optional[str] = None,
-                    tencent_key: Optional[str] = None,
-                    baidu_creds_json_str: Optional[str] = None) -> List[str]:
     if not texts:
         return []
-    use_tencent_id, use_tencent_key = None, None
-    use_baidu_creds = []
-    if tencent_id and tencent_key:
-        use_tencent_id, use_tencent_key = tencent_id, tencent_key
-        print("[translator] Using custom Tencent API key.")
-    if baidu_creds_json_str:
-        try:
-            creds = json.loads(baidu_creds_json_str)
-            if isinstance(creds, list) and all(isinstance(d, dict) for d in creds):
-                use_baidu_creds = creds
-                print("[translator] Using custom Baidu API key(s).")
-            else:
-                 print("[translator] Warning: Custom Baidu credentials format is incorrect.")
-        except json.JSONDecodeError:
-            print("[translator] Warning: Failed to parse custom Baidu credentials JSON.")
-    elif TRANSLATOR_ACCESS_KEY and system_key_input == TRANSLATOR_ACCESS_KEY:
-        print("[translator] System access key validated. Using system-configured API keys.")
-        use_tencent_id, use_tencent_key = TENCENT_SECRET_ID, TENCENT_SECRET_KEY
-        use_baidu_creds = BAIDU_CREDENTIALS_DEFAULT
-    else:
-        print("[translator] Translation disabled: No valid API keys or system key provided.")
-        return list(texts)
-    translated_texts = None
-    if use_tencent_id and use_tencent_key:
-        translated_texts = _translate_with_tencent(texts, src_lang, tgt_lang, use_tencent_id, use_tencent_key)
-    if translated_texts is None and use_baidu_creds:
-        translated_texts = _translate_with_baidu(texts, src_lang, tgt_lang, use_baidu_creds)
-    return translated_texts or list(texts)

+"""
+translator.py
+腾讯云 + 百度翻译 API 轮询封装
+⚠️ 需在 HF 空间的 “Variables” 页设置以下环境变量
+------------------------------------------------------------------
+TENCENT_SECRET_ID        腾讯云 SecretId
+TENCENT_SECRET_KEY       腾讯云 SecretKey
+TENCENT_TRANSLATE_URL    (可选) 默认 https://tmt.tencentcloudapi.com
+BAIDU_TRANSLATE_URL      (可选) 默认 https://fanyi-api.baidu.com/api/trans/vip/translate
+BAIDU_CREDENTIALS_JSON   形如:
+[
+  {"app_id": "xxxx", "secret_key": "yyyy"},
+  {"app_id": "aaaa", "secret_key": "bbbb"}
+]
+------------------------------------------------------------------
+"""
 import hashlib, hmac, json, os, random, time
 from datetime import datetime
+from typing import List, Sequence, Optional
 import requests
+# ------------------------------------------------------------------
+# 读取环境变量
+# ------------------------------------------------------------------
+TENCENT_SECRET_ID  = os.environ.get("TENCENT_SECRET_ID")
 TENCENT_SECRET_KEY = os.environ.get("TENCENT_SECRET_KEY")
 TENCENT_TRANSLATE_URL = os.environ.get("TENCENT_TRANSLATE_URL", "https://tmt.tencentcloudapi.com")
 BAIDU_TRANSLATE_URL = os.environ.get("BAIDU_TRANSLATE_URL", "https://fanyi-api.baidu.com/api/trans/vip/translate")
+BAIDU_CREDENTIALS   = json.loads(os.environ.get("BAIDU_CREDENTIALS_JSON", "[]"))
+# 内部轮询索引
+_baidu_idx: int = 0
+def _next_baidu_cred():
+    global _baidu_idx
+    if not BAIDU_CREDENTIALS:
+        return None
+    cred = BAIDU_CREDENTIALS[_baidu_idx]
+    _baidu_idx = (_baidu_idx + 1) % len(BAIDU_CREDENTIALS)
+    return cred
+# ------------------------------------------------------------------
+# 腾讯翻译
+# ------------------------------------------------------------------
 def _sign(key: bytes, msg: str) -> bytes:
     return hmac.new(key, msg.encode("utf-8"), hashlib.sha256).digest()
 def _tc3_signature(secret_key: str, date: str, service: str, string_to_sign: str) -> str:
+    secret_date     = _sign(("TC3" + secret_key).encode(), date)
+    secret_service  = _sign(secret_date, service)
+    secret_signing  = _sign(secret_service, "tc3_request")
     return hmac.new(secret_signing, string_to_sign.encode("utf-8"), hashlib.sha256).hexdigest()
+def _translate_with_tencent(texts: Sequence[str], src="auto", tgt="zh") -> Optional[List[str]]:
+    """优先使用腾讯云翻译。失败返回 None"""
+    if not (TENCENT_SECRET_ID and TENCENT_SECRET_KEY):
+        return None                                           # 未配置凭证
+    service  = "tmt"
+    host     = "tmt.tencentcloudapi.com"
+    action   = "TextTranslate"
+    version  = "2018-03-21"
+    region   = "ap-beijing"
+    ts       = int(time.time())
+    date     = datetime.utcfromtimestamp(ts).strftime("%Y-%m-%d")
+    algorithm = "TC3-HMAC-SHA256"
+    payload = {
+        "SourceText": "\n".join(texts),
+        "Source":     src,
+        "Target":     tgt,
+        "ProjectId":  0,
+    }
     payload_str = json.dumps(payload, ensure_ascii=False)
+    # ---------- step‑1 canonical request ----------
+    canonical_request = "\n".join([
+        "POST",
+        "/",
+        "",
+        f"content-type:application/json; charset=utf-8\nhost:{host}\nx-tc-action:{action.lower()}\n",
+        "content-type;host;x-tc-action",
+        hashlib.sha256(payload_str.encode()).hexdigest(),
+    ])
+    # ---------- step‑2 string to sign ----------
+    credential_scope   = f"{date}/{service}/tc3_request"
+    string_to_sign     = "\n".join([
+        algorithm, str(ts), credential_scope,
+        hashlib.sha256(canonical_request.encode()).hexdigest(),
+    ])
+    # ---------- step‑3 signature ----------
+    signature = _tc3_signature(TENCENT_SECRET_KEY, date, service, string_to_sign)
+    # ---------- step‑4 headers ----------
+    authorization = (
+        f"{algorithm} Credential={TENCENT_SECRET_ID}/{credential_scope}, "
+        f"SignedHeaders=content-type;host;x-tc-action, Signature={signature}"
+    )
     headers = {
+        "Authorization":  authorization,
+        "Content-Type":   "application/json; charset=utf-8",
+        "Host":           host,
+        "X-TC-Action":    action,
+        "X-TC-Timestamp": str(ts),
+        "X-TC-Version":   version,
+        "X-TC-Region":    region,
     }
+    # ---------- request ----------
     try:
         resp = requests.post(TENCENT_TRANSLATE_URL, headers=headers, data=payload_str, timeout=8)
         resp.raise_for_status()
         data = resp.json()
+        return data["Response"]["TargetText"].split("\n")
     except Exception as e:
         print(f"[translator] Tencent API error → {e}")
         return None
+# ------------------------------------------------------------------
+# 百度翻译
+# ------------------------------------------------------------------
+def _translate_with_baidu(texts: Sequence[str], src="auto", tgt="zh") -> Optional[List[str]]:
+    creds = _next_baidu_cred()
+    if creds is None:
+        return None                                           # 未配置凭证
+    app_id, secret_key = creds["app_id"], creds["secret_key"]
+    salt  = random.randint(32768, 65536)
     query = "\n".join(texts)
+    sign  = hashlib.md5((app_id + query + str(salt) + secret_key).encode()).hexdigest()
+    params = {
+        "q": query, "from": src, "to": tgt,
+        "appid": app_id, "salt": salt, "sign": sign,
+    }
     try:
         resp = requests.get(BAIDU_TRANSLATE_URL, params=params, timeout=8)
         resp.raise_for_status()
         data = resp.json()
+        return [item["dst"] for item in data["trans_result"]]
     except Exception as e:
         print(f"[translator] Baidu API error → {e}")
         return None
+# ------------------------------------------------------------------
+# 对外统一函数
+# ------------------------------------------------------------------
 def translate_texts(texts: Sequence[str],
                     src_lang: str = "auto",
+                    tgt_lang: str = "zh") -> List[str]:
+    """
+    优先 Tencent → 失败再 Baidu → 如果都失败，返回原文。
+    """
     if not texts:
         return []
+    out = _translate_with_tencent(texts, src_lang, tgt_lang)
+    if out is None:
+        out = _translate_with_baidu(texts, src_lang, tgt_lang)
+    return out or list(texts)