PupperRecoilProject · Weiyu1105 · Aug 4, 2025
diff --git a/config.py b/config.py
@@ -39,7 +39,7 @@ class AppConfig:
     keyboard_velocity_adjust_step: float
     gamepad_sensitivity: Dict[str, float]
     param_adjust_steps: Dict[str, float]
-
+    default_pose: List[float]  # 【新增】預設站姿
     initial_tuning_params: TuningParamsConfig
     floating_controller: FloatingControllerConfig
 
@@ -74,7 +74,8 @@ def load_config(path: str = "config.yaml") -> AppConfig:
         keyboard_velocity_adjust_step=config_data['keyboard_velocity_adjust_step'],
         gamepad_sensitivity=config_data['gamepad_sensitivity'],
         param_adjust_steps=config_data['param_adjust_steps'],
-
+
+        default_pose=config_data['default_pose'],  # 新增欄位
         initial_tuning_params=tuning_params,
         floating_controller=floating_config
     )

diff --git a/config.yaml b/config.yaml
@@ -67,6 +67,7 @@ policy_transition_duration: 0.5 # 平滑過渡的持續時間 (秒)
 
 # 核心參數 (Core Parameters)
 num_motors: 12
+default_pose: [0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]  # 【新增】預設站姿
 physics_timestep: 0.004 # <-- 建議修改：提高模擬精度以增強穩定性
 control_freq: 50.0
 warmup_duration: 0.0

diff --git a/hardware_controller.py b/hardware_controller.py
@@ -8,6 +8,7 @@
 import numpy as np
 from scipy.spatial.transform import Rotation
 from typing import TYPE_CHECKING
+from utils.observation_utils import calculate_relative_joint_positions
 
 if TYPE_CHECKING:
     from config import AppConfig
@@ -19,44 +20,47 @@ class RobotStateHardware:
     """【修改】只儲存AI決策所需的、單位正確的數據。"""
     def __init__(self):
         # 這些是直接從Teensy的POLICY_STREAM解析來的數據
-        self.angular_velocity_radps = np.zeros(3, dtype=np.float32)
-        self.gravity_vector_norm = np.zeros(3, dtype=np.float32)
-        self.accelerometer_ms2 = np.zeros(3, dtype=np.float32)
-        self.pitch_rad = 0.0
-        self.joint_positions_rad = np.zeros(12, dtype=np.float32)
-        self.joint_velocities_radps = np.zeros(12, dtype=np.float32)
-        
+        self.angular_velocity_radps = np.zeros(3, dtype=np.float32)  # 角速度 (rad/s)
+        self.gravity_vector_norm = np.zeros(3, dtype=np.float32)  # 標準化的重力向量
+        self.accelerometer_ms2 = np.zeros(3, dtype=np.float32)  # 加速度 (m/s^2)
+        self.pitch_rad = 0.0  # 俯仰角 (rad)
+        self.joint_positions_rad = np.zeros(12, dtype=np.float32)  # 關節絕對角度 (rad)
+        self.joint_velocities_radps = np.zeros(12, dtype=np.float32)  # 關節角速度 (rad/s)
+
         # 這些是PC端自己維護的狀態
-        self.last_action = np.zeros(12, dtype=np.float32)
-        self.command = np.zeros(3, dtype=np.float32)
-        
-        self.last_update_time = 0.0
+        self.last_action = np.zeros(12, dtype=np.float32)  # 上一幀的AI動作輸出
+        self.command = np.zeros(3, dtype=np.float32)  # 使用者指令
+
+        self.last_update_time = 0.0  # 上次收到Teensy數據的時間戳
 
 class HardwareController:
     """【修改版】管理與實體硬體的AI控制迴圈，從SerialCommunicator借用連接。"""
-    
+
     def __init__(self, config: 'AppConfig', policy: 'PolicyManager', global_state: 'SimulationState', serial_comm: 'SerialCommunicator'):
         """【修改】初始化時接收 SerialCommunicator 的參考。"""
         self.config = config
         self.policy = policy
         self.global_state = global_state
-        self.serial_comm = serial_comm 
-
-        self.ser = None 
-        self.is_running = False 
-        self.read_thread = None 
-        self.control_thread = None 
-
-        self.hw_state = RobotStateHardware()
-        self.lock = threading.Lock()
-        self.ai_control_enabled = threading.Event()
-
-        self.foot_positions_in_body = np.array([
-            [-0.0804, -0.1759, -0.1964],
-            [ 0.0806, -0.1759, -0.1964],
-            [-0.0804,  0.0239, -0.1964],
-            [ 0.0806,  0.0239, -0.1964],
-        ], dtype=np.float32)
+        self.serial_comm = serial_comm  # 保存序列通訊器的參考
+
+        self.ser = None  # 序列埠物件
+        self.is_running = False  # 執行緒運行旗標
+        self.read_thread = None  # 讀取執行緒
+        self.control_thread = None  # 控制執行緒
+
+        self.hw_state = RobotStateHardware()  # 實體機器人狀態物件
+        self.lock = threading.Lock()  # 保護 hw_state 的執行緒鎖
+        self.ai_control_enabled = threading.Event()  # 用於啟用/暫停AI控制的事件
+
+        # 【修改】從設定檔取得預設站姿，避免依賴模擬器
+        self.default_pose = np.array(self.config.default_pose, dtype=np.float32)
+
+        # 控制模式分派表，使用策略模式減少 if-else
+        self.control_dispatch = {
+            "JOINT_TEST": self._cmd_joint_test,
+            "HARDWARE_MODE": self._cmd_hardware_mode,
+        }
+
         log.info("✅ 硬體控制器已初始化。")
 
     def start_controller_threads(self):
@@ -84,13 +88,13 @@ def start_controller_threads(self):
         # 自動切換 Teensy 到 AI 決策流模式
         try:
             log.info("  -> 正在命令 Teensy 切換至 POLICY_STREAM 模式...")
-            self.ser.write(b"monitor p\n")
-            time.sleep(0.1) # 給Teensy一點時間切換模式並清空緩衝區
+            self.ser.write(b"monitor p\n")  # 發送 'monitor p' 指令
+            time.sleep(0.1)  # 給Teensy一點時間切換模式並清空緩衝區
             self.ser.reset_input_buffer()
             log.info("  -> Teensy 模式切換指令已發送。")
         except serial.SerialException as e:
             log.error(f"❌ 發送模式切換指令失敗: {e}")
-            self.stop_controller_threads() # 使用現有的停止函式來清理
+            self.stop_controller_threads()
             return
 
         # 後續的執行緒啟動邏輯
@@ -110,14 +114,14 @@ def start_controller_threads(self):
 
     def stop_controller_threads(self):
         """【修改】在停止執行緒後，自動命令Teensy恢復到安全的人類友好模式。"""
-        if not self.is_running: return
-
+        if not self.is_running:
+            return
+
         log.info("正在停止硬體控制器...")
         self.is_running = False
         self.disable_ai()
-        self.ai_control_enabled.set() 
-
-        # 在交還控制權前，命令Teensy恢復安全狀態
+        self.ai_control_enabled.set()  # 釋放可能在等待的控制執行緒
+
         if self.ser and self.ser.is_open:
             try:
                 log.info("  -> 正在命令 Teensy 停止運動並恢復 HUMAN 遙測模式...")
@@ -128,20 +132,20 @@ def stop_controller_threads(self):
             except serial.SerialException:
                 log.warning("  -> 警告: 發送停止指令失敗，可能連接已斷開。")
 
-        # 所有執行緒清理和交還控制權的邏輯
         if self.control_thread and self.control_thread.is_alive():
             self.control_thread.join(timeout=1)
         if self.read_thread and self.read_thread.is_alive():
             self.read_thread.join(timeout=1)
-        
+
         if self.serial_comm:
             self.serial_comm.is_managed_by_hardware_controller = False
             log.info("序列埠控制權已交還。")
-        
+
         self.ser = None
         log.info("硬體控制器已完全停止。")
-        
+
     def enable_ai(self):
+        """啟用AI控制。"""
         if not self.is_running:
             log.info("無法啟用 AI：硬體控制器未運行。")
             return
@@ -151,25 +155,23 @@ def enable_ai(self):
         self.global_state.hardware_ai_is_active = True
 
     def disable_ai(self):
+        """禁用AI控制，並發送停止指令給機器人。"""
         log.info("⏸️ AI 控制已暫停。")
         self.ai_control_enabled.clear()
         self.global_state.hardware_ai_is_active = False
-        if self.is_running and self.ser and self.ser.is_open: # 增加 is_running 判斷
-            try: self.ser.write(b"stop\n")
+        if self.is_running and self.ser and self.ser.is_open:
+            try:
+                self.ser.write(b"stop\n")
             except serial.SerialException as e:
                 log.error(f"發送停止指令失敗: {e}")
 
     def parse_policy_stream(self, line: str):
-        """
-        專門解析來自 Teensy 'monitor p' 模式的 34 維數據流。
-        """
+        """專門解析來自 Teensy 'monitor p' 模式的 34 維數據流。"""
         try:
             parts = line.split(',')
             if len(parts) != 34:
                 return
-
             data_vec = np.array(parts, dtype=np.float32)
-
             with self.lock:
                 self.hw_state.angular_velocity_radps[:] = data_vec[0:3]
                 self.hw_state.gravity_vector_norm[:] = data_vec[3:6]
@@ -178,43 +180,39 @@ def parse_policy_stream(self, line: str):
                 self.hw_state.joint_positions_rad[:] = data_vec[10:22]
                 self.hw_state.joint_velocities_radps[:] = data_vec[22:34]
                 self.hw_state.last_update_time = time.time()
-
         except (ValueError, IndexError) as e:
             log.error(f"❌ 解析 POLICY_STREAM 時出錯: {e} | 原始數據長度: {len(parts)}")
 
     def construct_observation(self) -> np.ndarray:
         """
-        [全新重構] 從 hw_state 中直接獲取數據，並拼接成最終的 ONNX 輸入向量。
-        不再需要任何客戶端的估算。
+        [全新重構] 從 hw_state 中獲取數據，並拼接成最終的 ONNX 輸入向量。
+        【核心修復】此處修正了關節角度和線性速度的問題。
         """
         with self.lock:
-            # 【保留】從全域狀態獲取用戶指令
             self.hw_state.command = self.global_state.command * np.array(self.config.command_scaling_factors)
-
-            # 【修改】建立一個全新的、數據源清晰的字典
+
+            # 【核心修復 #1】使用工具函式計算相對關節角度
+            relative_joint_positions = calculate_relative_joint_positions(
+                self.hw_state.joint_positions_rad, self.default_pose
+            )
+
             obs_list = {
-                # --- 來自Teensy的高品質數據 ---
                 'angular_velocity': self.hw_state.angular_velocity_radps,
                 'gravity_vector': self.hw_state.gravity_vector_norm,
                 'accelerometer': self.hw_state.accelerometer_ms2,
-                'pitch': np.array([self.hw_state.pitch_rad]), # 確保是1維向量
-                'joint_positions': self.hw_state.joint_positions_rad,
+                'pitch': np.array([self.hw_state.pitch_rad]),
+                'joint_positions': relative_joint_positions,
                 'joint_velocities': self.hw_state.joint_velocities_radps,
-
-                # --- PC端自行維護的狀態 ---
                 'last_action': self.hw_state.last_action,
                 'commands': self.hw_state.command,
-
-                # --- 為了兼容性，保留舊的鍵，用零填充 ---
-                'linear_velocity': np.zeros(3), 
+                # 【核心修復 #2】硬體無法提供線速度，用零填充
+                'linear_velocity': np.zeros(3),
             }
-
-            # 【保留】由配方驅動的拼接邏輯
+
             recipe = self.policy.get_active_recipe()
             if not recipe:
                 log.warning("⚠️ 警告: 無法從策略管理器獲取有效的觀察配方。")
                 return np.array([])
-
             try:
                 final_obs_list = [obs_list[key] for key in recipe]
                 return np.concatenate(final_obs_list).astype(np.float32)
@@ -223,72 +221,61 @@ def construct_observation(self) -> np.ndarray:
                 return np.array([])
 
     def _read_from_port(self):
+        """背景執行緒：從序列埠讀取數據。"""
         log.info("[硬體讀取線程已啟動] 等待來自 Teensy 的 POLICY_STREAM 數據...")
         while self.is_running:
             if not self.ser or not self.ser.is_open:
-                # 【修改】確保呼叫正確的停止函式
                 self.stop_controller_threads()
                 break
             try:
                 line = self.ser.readline().decode('utf-8', errors='ignore').strip()
                 if line:
-                    # 【修改】呼叫新的解析器
-                    self.parse_policy_stream(line) 
+                    self.parse_policy_stream(line)
             except (serial.SerialException, OSError):
                 log.error("❌ 錯誤：序列埠斷開連接或讀取錯誤。")
                 self.stop_controller_threads()
                 break
             except Exception as e:
                 log.error(f"❌ _read_from_port 發生未知錯誤: {e}")
-                
+
     def _control_loop(self):
-        """【保留大部分邏輯】此迴圈現在是硬體指令的唯一來源，並能感知 JOINT_TEST 模式。"""
+        """背景執行緒：根據模式生成並發送控制指令。"""
         log.info("\n--- 硬體控制執行緒已就緒 ---")
-        # 【保留】 default_pose_hardware 保持不變
-        default_pose_hardware = self.global_state.sim.default_pose
+
         while self.is_running:
             loop_start_time = time.perf_counter()
-            command_to_send = None
-
-            # 【保留】 JOINT_TEST 模式的指令生成邏輯不變
-            if self.global_state.control_mode == "JOINT_TEST":
-                final_command = default_pose_hardware + self.global_state.joint_test_offsets
-                action_str = ' '.join(f"{a:.4f}" for a in final_command)
-                command_to_send = f"move all {action_str}\n"
-
-            # 【保留】 HARDWARE_MODE 的指令生成邏輯
-            elif self.global_state.control_mode == "HARDWARE_MODE":
-                # 【保留】等待AI啟用信號
-                self.ai_control_enabled.wait()
-                if not self.is_running: break
-
-                # 【保留】呼叫新的 construct_observation 函式
-                # 這個函式現在會使用 RobotStateHardware 中更新過的高品質數據
-                observation = self.construct_observation()
-                if observation.size == 0:
-                    time.sleep(0.02); continue
-
-                # 【保留】運行AI策略獲取動作
-                _, action_raw = self.policy.get_action_for_hardware(observation)
-                with self.lock:
-                    # 【保留】更新 last_action
-                    self.hw_state.last_action[:] = action_raw
-
-                # 【保留】生成發送給Teensy的文字指令
-                final_command = default_pose_hardware + action_raw * self.global_state.tuning_params.action_scale
-                action_str = ' '.join(f"{a:.4f}" for a in final_command)
-                command_to_send = f"move all {action_str}\n"
-
-            # 【保留】發送指令邏輯
+            handler = self.control_dispatch.get(self.global_state.control_mode)
+            command_to_send = handler() if handler else None
+
             if command_to_send and self.ser and self.ser.is_open:
                 try:
                     self.ser.write(command_to_send.encode('utf-8'))
                 except serial.SerialException:
-                    # 【修改】確保呼叫一致的停止函式
-                    self.stop_controller_threads() # <--- 這裡從 self.stop() 改為 self.stop_controller_threads()
-
-            # 【保留】迴圈時間管理
+                    self.stop_controller_threads()
+
             loop_duration = time.perf_counter() - loop_start_time
             sleep_time = (1.0 / self.config.control_freq) - loop_duration
             if sleep_time > 0:
                 time.sleep(sleep_time)
+
+    def _cmd_joint_test(self) -> str | None:
+        """關節手動測試模式的指令。"""
+        final_command = self.default_pose + self.global_state.joint_test_offsets
+        action_str = ' '.join(f"{a:.4f}" for a in final_command)
+        return f"move all {action_str}\n"
+
+    def _cmd_hardware_mode(self) -> str | None:
+        """硬體 AI 模式的指令。"""
+        self.ai_control_enabled.wait()
+        if not self.is_running:
+            return None
+        observation = self.construct_observation()
+        if observation.size == 0:
+            time.sleep(0.02)
+            return None
+        _, action_raw = self.policy.get_action_for_hardware(observation)
+        with self.lock:
+            self.hw_state.last_action[:] = action_raw
+        final_command = self.default_pose + action_raw * self.global_state.tuning_params.action_scale
+        action_str = ' '.join(f"{a:.4f}" for a in final_command)
+        return f"move all {action_str}\n"