Spaces:

Madras1
/

jade_port

Running

App Files Files Community

Madras1 commited on 8 days ago

Commit

594f99d

verified ·

1 Parent(s): 1e07757

Upload 14 files

Browse files

Files changed (4) hide show

app.py +28 -17
gitattributes +35 -0
jade/heavy_mode.py +226 -0
requirements.txt +3 -0

app.py CHANGED Viewed

@@ -2,6 +2,7 @@
 import os
 import base64
 import io
 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.staticfiles import StaticFiles
@@ -9,10 +10,14 @@ from pydantic import BaseModel
 from PIL import Image
 from jade.core import JadeAgent
 from jade.scholar import ScholarAgent
 print("Iniciando a J.A.D.E. com FastAPI...")
 jade_agent = JadeAgent()
 scholar_agent = ScholarAgent()
 print("J.A.D.E. pronta para receber requisições.")
 app = FastAPI(title="J.A.D.E. API")
@@ -26,17 +31,17 @@ os.makedirs("backend/generated", exist_ok=True)
 app.mount("/generated", StaticFiles(directory="backend/generated"), name="generated")
 # Dicionário global para armazenar sessões de usuários
-# Structure: user_sessions[user_id] = { "jade": [...], "scholar": [...] }
 user_sessions = {}
 class UserRequest(BaseModel):
     user_input: str
     image_base64: str | None = None
     user_id: str | None = None
-    agent_type: str = "jade" # "jade" or "scholar"
 @app.post("/chat")
-def handle_chat(request: UserRequest):
     try:
         user_id = request.user_id if request.user_id else "default_user"
         agent_type = request.agent_type.lower()
@@ -45,12 +50,14 @@ def handle_chat(request: UserRequest):
             print(f"Nova sessão criada para: {user_id}")
             user_sessions[user_id] = {
                 "jade": [jade_agent.system_prompt],
-                "scholar": []
             }
-        # Ensure sub-keys exist if session existed but new agent type is used
         if "jade" not in user_sessions[user_id]: user_sessions[user_id]["jade"] = [jade_agent.system_prompt]
         if "scholar" not in user_sessions[user_id]: user_sessions[user_id]["scholar"] = []
         vision_context = None
         if request.image_base64:
@@ -58,7 +65,7 @@ def handle_chat(request: UserRequest):
                 header, encoded_data = request.image_base64.split(",", 1)
                 image_bytes = base64.b64decode(encoded_data)
                 pil_image = Image.open(io.BytesIO(image_bytes))
-                # Only Jade handles vision for now, but we can pass context if needed
                 vision_context = jade_agent.image_handler.process_pil_image(pil_image)
             except Exception as img_e:
                 print(f"Erro ao processar imagem Base64: {img_e}")
@@ -78,9 +85,22 @@ def handle_chat(request: UserRequest):
                 vision_context=vision_context
             )
             user_sessions[user_id]["scholar"] = updated_history
         else:
             # Default to J.A.D.E.
             current_history = user_sessions[user_id]["jade"]
             bot_response_text, audio_path, updated_history = jade_agent.respond(
                 history=current_history,
                 user_input=final_user_input,
@@ -89,16 +109,7 @@ def handle_chat(request: UserRequest):
             )
             user_sessions[user_id]["jade"] = updated_history
-        # LÓGICA DO ÁUDIO: Converte o arquivo MP3 gerado para Base64
-        # Scholar agent might return a path to a static file instead of a temp file to be deleted.
-        # We need to distinguish.
-        # JadeAgent returns a temp file that is deleted.
-        # ScholarAgent returns a file in /generated/ that should PROBABLY remain accessible via URL,
-        # OR we can send it as base64 too.
-        # If the path starts with "backend/generated", we assume it is static and we might want to return the URL?
-        # BUT the frontend expects audio_base64 to play it immediately.
-        # So we can still base64 encode it for immediate playback.
         audio_base64 = None
         if audio_path and os.path.exists(audio_path):
             print(f"Codificando arquivo de áudio: {audio_path}")
@@ -106,7 +117,7 @@ def handle_chat(request: UserRequest):
                 audio_bytes = audio_file.read()
                 audio_base64 = base64.b64encode(audio_bytes).decode('utf-8')
-            # Only remove if it's NOT in generated (i.e. it's a temp file from Jade)
             if "backend/generated" not in audio_path:
                 os.remove(audio_path)

 import os
 import base64
 import io
+import asyncio
 from fastapi import FastAPI
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.staticfiles import StaticFiles
 from PIL import Image
 from jade.core import JadeAgent
 from jade.scholar import ScholarAgent
+from jade.heavy_mode import JadeHeavyAgent
 print("Iniciando a J.A.D.E. com FastAPI...")
 jade_agent = JadeAgent()
 scholar_agent = ScholarAgent()
+# Instantiate Heavy Agent. It uses environment variables.
+jade_heavy_agent = JadeHeavyAgent()
 print("J.A.D.E. pronta para receber requisições.")
 app = FastAPI(title="J.A.D.E. API")
 app.mount("/generated", StaticFiles(directory="backend/generated"), name="generated")
 # Dicionário global para armazenar sessões de usuários
+# Structure: user_sessions[user_id] = { "jade": [...], "scholar": [...], "heavy": [...] }
 user_sessions = {}
 class UserRequest(BaseModel):
     user_input: str
     image_base64: str | None = None
     user_id: str | None = None
+    agent_type: str = "jade" # "jade", "scholar", "heavy"
 @app.post("/chat")
+async def handle_chat(request: UserRequest):
     try:
         user_id = request.user_id if request.user_id else "default_user"
         agent_type = request.agent_type.lower()
             print(f"Nova sessão criada para: {user_id}")
             user_sessions[user_id] = {
                 "jade": [jade_agent.system_prompt],
+                "scholar": [],
+                "heavy": []
             }
+        # Ensure sub-keys exist
         if "jade" not in user_sessions[user_id]: user_sessions[user_id]["jade"] = [jade_agent.system_prompt]
         if "scholar" not in user_sessions[user_id]: user_sessions[user_id]["scholar"] = []
+        if "heavy" not in user_sessions[user_id]: user_sessions[user_id]["heavy"] = []
         vision_context = None
         if request.image_base64:
                 header, encoded_data = request.image_base64.split(",", 1)
                 image_bytes = base64.b64decode(encoded_data)
                 pil_image = Image.open(io.BytesIO(image_bytes))
+                # Jade handles vision processing
                 vision_context = jade_agent.image_handler.process_pil_image(pil_image)
             except Exception as img_e:
                 print(f"Erro ao processar imagem Base64: {img_e}")
                 vision_context=vision_context
             )
             user_sessions[user_id]["scholar"] = updated_history
+        elif agent_type == "heavy":
+            current_history = user_sessions[user_id]["heavy"]
+            # Heavy agent is async
+            bot_response_text, audio_path, updated_history = await jade_heavy_agent.respond(
+                history=current_history,
+                user_input=final_user_input,
+                user_id=user_id,
+                vision_context=vision_context
+            )
+            user_sessions[user_id]["heavy"] = updated_history
         else:
             # Default to J.A.D.E.
             current_history = user_sessions[user_id]["jade"]
+            # Jade agent is synchronous, run directly
             bot_response_text, audio_path, updated_history = jade_agent.respond(
                 history=current_history,
                 user_input=final_user_input,
             )
             user_sessions[user_id]["jade"] = updated_history
+        # Audio Logic
         audio_base64 = None
         if audio_path and os.path.exists(audio_path):
             print(f"Codificando arquivo de áudio: {audio_path}")
                 audio_bytes = audio_file.read()
                 audio_base64 = base64.b64encode(audio_bytes).decode('utf-8')
+            # Remove only if temp file
             if "backend/generated" not in audio_path:
                 os.remove(audio_path)

gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

jade/heavy_mode.py ADDED Viewed

	@@ -0,0 +1,226 @@

+import os
+import asyncio
+import random
+import re
+import json
+import logging
+from colorama import Fore, Style
+from groq import AsyncGroq, RateLimitError
+from mistralai import Mistral
+from openai import AsyncOpenAI
+import traceback
+# Configura logger local
+logger = logging.getLogger("JadeHeavy")
+logger.setLevel(logging.INFO)
+class JadeHeavyAgent:
+    def __init__(self):
+        self.groq_api_key = os.getenv("GROQ_API_KEY")
+        self.mistral_api_key = os.getenv("MISTRAL_API_KEY")
+        self.openrouter_api_key = os.getenv("OPENROUTER_API_KEY")
+        if not self.groq_api_key:
+            logger.warning("GROQ_API_KEY not set. Jade Heavy may fail.")
+        self.groq_client = AsyncGroq(api_key=self.groq_api_key)
+        self.mistral = None
+        if self.mistral_api_key:
+            self.mistral = Mistral(api_key=self.mistral_api_key)
+        else:
+            logger.warning("MISTRAL_API_KEY not set. Mistral model will be skipped or substituted.")
+        self.openrouter = None
+        if self.openrouter_api_key:
+            self.openrouter = AsyncOpenAI(
+                base_url="https://openrouter.ai/api/v1",
+                api_key=self.openrouter_api_key,
+            )
+        else:
+            logger.warning("OPENROUTER_API_KEY not set. Qwen/OpenRouter models will be skipped.")
+        # Updated Model Map for Generalist Chat
+        self.models = {
+            "Kimi": "moonshotai/kimi-k2-instruct-0905",      # Groq (Logic/Reasoning)
+            "Mistral": "mistral-large-latest",               # Mistral API
+            "Llama": "meta-llama/llama-4-maverick-17b-128e-instruct", # Groq
+            "Qwen": "qwen/qwen-2.5-coder-32b-instruct"       # OpenRouter (Fallback if key exists) or Groq equivalent
+            # Note: The original script used qwen/qwen3-235b... on OpenRouter.
+            # If no OpenRouter key, we might need a fallback on Groq or skip.
+        }
+        # Judge model (Groq is fast and cheap)
+        self.judge_id = "moonshotai/kimi-k2-instruct-0905"
+    async def _safe_propose(self, model_name, history_text):
+        """Phase 1: Strategic Planning"""
+        # Staggering to avoid rate limits
+        delay_map = {"Kimi": 0, "Mistral": 1.0, "Llama": 2.0, "Qwen": 3.0}
+        await asyncio.sleep(delay_map.get(model_name, 1) + random.uniform(0.1, 0.5))
+        sys_prompt = (
+            "You are a Strategic Architect. Create a high-level roadmap to answer the user's request comprehensively.\n"
+            "DO NOT write the final response yet. Just plan the structure and key points.\n"
+            "FORMAT: 1. [INTENT ANALYSIS] 2. [KEY POINTS] 3. [STRUCTURE PROPOSAL]"
+        )
+        messages = [{"role": "system", "content": sys_prompt}, {"role": "user", "content": history_text}]
+        try:
+            content = ""
+            if model_name == "Mistral" and self.mistral:
+                resp = await self.mistral.chat.complete_async(model=self.models["Mistral"], messages=messages)
+                content = resp.choices[0].message.content
+            elif model_name == "Qwen" and self.openrouter:
+                 # Use OpenRouter if available
+                resp = await self.openrouter.chat.completions.create(model="qwen/qwen3-235b-a22b:free", messages=messages) # Using the large free one if possible
+                content = resp.choices[0].message.content
+            else:
+                # Default to Groq (Kimi, Llama, or fallback for others)
+                # If Mistral/OpenRouter key missing, fallback to Llama-3-70b on Groq for diversity?
+                target_model = self.models.get(model_name)
+                if not target_model or (model_name == "Mistral" and not self.mistral) or (model_name == "Qwen" and not self.openrouter):
+                     target_model = "llama-3.3-70b-versatile" # Fallback
+                resp = await self.groq_client.chat.completions.create(
+                    model=target_model,
+                    messages=messages,
+                    temperature=0.7
+                )
+                content = resp.choices[0].message.content
+            if content:
+                return f"--- {model_name} Plan ---\n{content}"
+        except Exception as e:
+            logger.error(f"Error in propose ({model_name}): {e}")
+            return ""
+        return ""
+    async def _safe_expand(self, model_name, history_text, strategy):
+        """Phase 3: Execution/Expansion"""
+        delay_map = {"Kimi": 0, "Mistral": 1.5, "Llama": 3.0, "Qwen": 4.5}
+        await asyncio.sleep(delay_map.get(model_name, 1))
+        sys_prompt = (
+            f"You are a Precision Engine. Execute the following plan to answer the user request:\n\n{strategy}\n\n"
+            "Write a detailed, natural, and high-quality response following this plan.\n"
+            "Do not output internal reasoning like '[DECOMPOSITION]', just the final response text."
+        )
+        messages = [{"role": "system", "content": sys_prompt}, {"role": "user", "content": history_text}]
+        try:
+            content = ""
+            if model_name == "Mistral" and self.mistral:
+                resp = await self.mistral.chat.complete_async(model=self.models["Mistral"], messages=messages)
+                content = resp.choices[0].message.content
+            elif model_name == "Qwen" and self.openrouter:
+                resp = await self.openrouter.chat.completions.create(model="qwen/qwen3-235b-a22b:free", messages=messages)
+                content = resp.choices[0].message.content
+            else:
+                target_model = self.models.get(model_name)
+                if not target_model or (model_name == "Mistral" and not self.mistral) or (model_name == "Qwen" and not self.openrouter):
+                     target_model = "llama-3.3-70b-versatile"
+                resp = await self.groq_client.chat.completions.create(
+                    model=target_model,
+                    messages=messages,
+                    temperature=0.7
+                )
+                content = resp.choices[0].message.content
+            if content:
+                return f"[{model_name} Draft]:\n{content}"
+        except Exception as e:
+            logger.error(f"Error in expand ({model_name}): {e}")
+            return ""
+        return ""
+    async def respond(self, history, user_input, user_id="default", vision_context=None):
+        """
+        Main entry point for the Heavy Agent.
+        History is a list of dicts: [{"role": "user", "content": "..."}...]
+        """
+        # Prepare context
+        full_context = ""
+        for msg in history[-6:]: # Limit context to last few turns to avoid huge prompts
+             full_context += f"{msg['role'].upper()}: {msg['content']}\n"
+        if vision_context:
+            full_context += f"SYSTEM (Vision): {vision_context}\n"
+        full_context += f"USER: {user_input}\n"
+        agents = ["Kimi", "Mistral", "Llama", "Qwen"]
+        # --- PHASE 1: STRATEGY ---
+        logger.info("Jade Heavy: Phase 1 - Planning...")
+        tasks = [self._safe_propose(m, full_context) for m in agents]
+        results = await asyncio.gather(*tasks)
+        valid_strats = [s for s in results if s]
+        if not valid_strats:
+            return "Failed to generate a plan.", None, history
+        # --- PHASE 2: PRUNING (Select Best Plan) ---
+        logger.info("Jade Heavy: Phase 2 - Pruning...")
+        prune_prompt = (
+            f"User Request Context:\n{full_context}\n\nProposed Plans:\n" +
+            "\n".join(valid_strats) +
+            "\n\nTASK: SELECT THE SINGLE MOST ROBUST AND HELPFUL PLAN. Return ONLY the content of the best plan."
+        )
+        try:
+            best_strat_resp = await self.groq_client.chat.completions.create(
+                model=self.judge_id,
+                messages=[{"role":"user","content":prune_prompt}],
+                temperature=0.1
+            )
+            best_strat = best_strat_resp.choices[0].message.content
+        except Exception as e:
+            logger.error(f"Pruning failed: {e}")
+            best_strat = valid_strats[0] # Fallback to first plan
+        # --- PHASE 3: EXPANSION (Drafting Responses) ---
+        logger.info("Jade Heavy: Phase 3 - Expansion...")
+        tasks_exp = [self._safe_expand(m, full_context, best_strat) for m in agents]
+        results_exp = await asyncio.gather(*tasks_exp)
+        valid_sols = [s for s in results_exp if s]
+        if not valid_sols:
+             return "Failed to generate drafts.", None, history
+        # --- PHASE 4: VERDICT (Synthesis) ---
+        logger.info("Jade Heavy: Phase 4 - Verdict...")
+        council_prompt = (
+            f"User Request:\n{full_context}\n\nCandidate Responses:\n" +
+            "\n".join(valid_sols) +
+            "\n\nTASK: Synthesize the best parts of these drafts into a FINAL, PERFECT RESPONSE."
+            "The response should be natural, helpful, and high-quality. Do not mention the agents or the process."
+        )
+        final_answer = ""
+        try:
+            resp = await self.groq_client.chat.completions.create(
+                model=self.judge_id,
+                messages=[{"role":"system","content":"You are the Chief Editor."},{"role":"user","content":council_prompt}],
+                temperature=0.4
+            )
+            final_answer = resp.choices[0].message.content
+        except Exception as e:
+            logger.error(f"Verdict failed: {e}")
+            final_answer = valid_sols[0].replace(f"[{agents[0]} Draft]:\n", "") # Fallback
+        # Update History
+        history.append({"role": "user", "content": user_input})
+        history.append({"role": "assistant", "content": final_answer})
+        # Audio (Optional/Placeholder - returning None for now or use TTS if needed)
+        # The user said "backend focuses on request", so we can skip TTS generation here
+        # or implement it if JadeAgent does it. The original code uses `jade_agent.tts`.
+        # For Heavy mode, maybe we skip audio for speed, or add it later.
+        # I'll return None for audio path.
+        return final_answer, None, history

requirements.txt CHANGED Viewed

@@ -25,3 +25,6 @@ faiss-cpu
 graphviz
 duckduckgo-search
 genanki

 graphviz
 duckduckgo-search
 genanki
+mistralai
+openai
+colorama