First

2025-11-12 17:04:47 +08:00
commit e0626adfb6
16 changed files with 986 additions and 0 deletions
--- a/.idea/.gitignore
+++ b/.idea/.gitignore
@@ -0,0 +1,5 @@
+# 默认忽略的文件
+/shelf/
+/workspace.xml
+# 基于编辑器的 HTTP 客户端请求
+/httpRequests/
--- a/.idea/AutoAnno.iml
+++ b/.idea/AutoAnno.iml
@@ -0,0 +1,10 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<module type="PYTHON_MODULE" version="4">
+  <component name="NewModuleRootManager">
+    <content url="file://$MODULE_DIR$">
+      <excludeFolder url="file://$MODULE_DIR$/.venv" />
+    </content>
+    <orderEntry type="jdk" jdkName="Python 3.11 (AutoAnno)" jdkType="Python SDK" />
+    <orderEntry type="sourceFolder" forTests="false" />
+  </component>
+</module>
--- a/.idea/inspectionProfiles/profiles_settings.xml
+++ b/.idea/inspectionProfiles/profiles_settings.xml
@@ -0,0 +1,6 @@
+<component name="InspectionProjectProfileManager">
+  <settings>
+    <option name="USE_PROJECT_PROFILE" value="false" />
+    <version value="1.0" />
+  </settings>
+</component>
--- a/.idea/misc.xml
+++ b/.idea/misc.xml
@@ -0,0 +1,7 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="Black">
+    <option name="sdkName" value="Python 3.11 (AutoAnno)" />
+  </component>
+  <component name="ProjectRootManager" version="2" project-jdk-name="Python 3.11 (AutoAnno)" project-jdk-type="Python SDK" />
+</project>
--- a/.idea/modules.xml
+++ b/.idea/modules.xml
@@ -0,0 +1,8 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="ProjectModuleManager">
+    <modules>
+      <module fileurl="file://$PROJECT_DIR$/.idea/AutoAnno.iml" filepath="$PROJECT_DIR$/.idea/AutoAnno.iml" />
+    </modules>
+  </component>
+</project>
--- a/.idea/vcs.xml
+++ b/.idea/vcs.xml
@@ -0,0 +1,6 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<project version="4">
+  <component name="VcsDirectoryMappings">
+    <mapping directory="$PROJECT_DIR$" vcs="Git" />
+  </component>
+</project>
--- a/autoanno.py
+++ b/autoanno.py
@@ -0,0 +1,129 @@
+import os
+import cv2
+import xml.etree.ElementTree as ET
+from xml.dom import minidom
+from ultralytics import YOLO
+
+# ========== 配置部分 ==========
+model_path = "epoch220.pt"
+input_dir = "test_images/"
+output_xml_dir = "annotations/"
+temp_dir = "temp_rgb_images"
+
+
+# ===== 自定义类别名称映射 =====
+class_mapping = {
+    0: "EM14",
+    1: "EM18",
+    2: "EM17",
+    3: "EM170",
+    4: "EM19",
+    5: "EM190",
+    6: "EM20",
+    7: "EM200",
+    8: "EM201",
+    9: "EM202",
+    10: "EM203",
+    11: "EM180",
+    12: "EM181"
+}
+
+
+
+os.makedirs(temp_dir, exist_ok=True)
+os.makedirs(output_xml_dir, exist_ok=True)
+
+# ========== 加载模型 ==========
+model = YOLO(model_path)
+
+
+
+
+# ========== 灰度转RGB ==========
+for file in os.listdir(input_dir):
+    if not file.lower().endswith(('.jpg', '.jpeg', '.png', '.bmp', '.tiff')):
+        continue
+
+    input_path = os.path.join(input_dir, file)
+    img = cv2.imread(input_path, cv2.IMREAD_UNCHANGED)
+
+    if len(img.shape) == 2 or img.shape[2] == 1:
+        img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
+
+    temp_path = os.path.join(temp_dir, file)
+    cv2.imwrite(temp_path, img)
+
+# ========== 执行检测 ==========
+results = model.predict(source=temp_dir, conf=0.2, save=False,classes=[11])
+
+# ========== 生成标准化VOC XML ==========
+for result in results:
+    file_name = os.path.basename(result.path)
+    image_path = os.path.join(input_dir, file_name)
+    img = cv2.imread(image_path)
+    height, width, depth = img.shape
+
+    annotation = ET.Element("annotation")
+
+    folder = ET.SubElement(annotation, "folder")
+    folder.text = os.path.basename(os.path.dirname(image_path))
+
+    filename = ET.SubElement(annotation, "filename")
+    filename.text = file_name
+
+    path = ET.SubElement(annotation, "path")
+    path.text = os.path.abspath(image_path)
+
+    source = ET.SubElement(annotation, "source")
+    database = ET.SubElement(source, "database")
+    database.text = "Unknown"
+
+    size = ET.SubElement(annotation, "size")
+    ET.SubElement(size, "width").text = str(width)
+    ET.SubElement(size, "height").text = str(height)
+    ET.SubElement(size, "depth").text = str(depth)
+
+    segmented = ET.SubElement(annotation, "segmented")
+    segmented.text = "0"
+
+    # 遍历检测框
+    for box in result.boxes:
+        cls = int(box.cls[0])
+        xyxy = box.xyxy[0].tolist()
+        xmin, ymin, xmax, ymax = map(int, xyxy)
+
+        obj = ET.SubElement(annotation, "object")
+
+        name = ET.SubElement(obj, "name")
+        name.text = class_mapping.get(cls, str(cls))
+
+
+        pose = ET.SubElement(obj, "pose")
+        pose.text = "Unspecified"
+
+        truncated = ET.SubElement(obj, "truncated")
+        truncated.text = "0"
+
+        difficult = ET.SubElement(obj, "difficult")
+        difficult.text = "0"
+
+        bndbox = ET.SubElement(obj, "bndbox")
+        ET.SubElement(bndbox, "xmin").text = str(xmin)
+        ET.SubElement(bndbox, "ymin").text = str(ymin)
+        ET.SubElement(bndbox, "xmax").text = str(xmax)
+        ET.SubElement(bndbox, "ymax").text = str(ymax)
+
+    # ===== 用 minidom 格式化输出 =====
+    rough_string = ET.tostring(annotation, 'utf-8')
+    reparsed = minidom.parseString(rough_string)
+    xml_str = reparsed.toprettyxml(indent="\t", encoding="utf-8").decode("utf-8")
+
+    # 去掉多余的第一行空行
+    xml_str = "\n".join([line for line in xml_str.splitlines() if line.strip()])
+
+    # 保存文件
+    xml_path = os.path.join(output_xml_dir, os.path.splitext(file_name)[0] + ".xml")
+    with open(xml_path, "w", encoding="utf-8") as f:
+        f.write(xml_str)
+
+    print(f"[生成完成] {xml_path}")
--- a/autoannogui.py
+++ b/autoannogui.py
@@ -0,0 +1,279 @@
+import os
+import cv2
+import sys
+import xml.etree.ElementTree as ET
+from xml.dom import minidom
+from ultralytics import YOLO
+from PyQt5.QtWidgets import (
+    QApplication, QWidget, QVBoxLayout, QHBoxLayout, QPushButton,
+    QLineEdit, QLabel, QFileDialog, QProgressBar, QTextEdit, QSlider
+)
+from PyQt5.QtCore import Qt, QThread, pyqtSignal
+
+
+# ========== 后台任务线程 ==========
+class DetectionThread(QThread):
+    update_model_progress = pyqtSignal(int)
+    update_xml_progress = pyqtSignal(int)
+    log_message = pyqtSignal(str)
+    finished_signal = pyqtSignal()
+
+    def __init__(self, model_path, input_dir, output_xml_dir, conf, classes):
+        super().__init__()
+        self.model_path = model_path
+        self.input_dir = input_dir
+        self.output_xml_dir = output_xml_dir
+        self.conf = conf
+        self.classes = classes
+
+        # 类别映射（可修改）
+        self.class_mapping = {
+            0: "EM14", 1: "EM18", 2: "EM17", 3: "EM170", 4: "EM19",
+            5: "EM190", 6: "EM20", 7: "EM200", 8: "EM201", 9: "EM202",
+            10: "EM203", 11: "EM180", 12: "EM181"
+        }
+
+    def run(self):
+        try:
+            os.makedirs(self.output_xml_dir, exist_ok=True)
+            temp_dir = os.path.join(self.output_xml_dir, "temp_rgb_images")
+            os.makedirs(temp_dir, exist_ok=True)
+
+            # 加载模型
+            self.log_message.emit(f"加载模型：{self.model_path}")
+            model = YOLO(self.model_path)
+            self.log_message.emit("模型加载完成 ✅")
+
+            # 读取图片列表
+            imgs = [f for f in os.listdir(self.input_dir)
+                    if f.lower().endswith(('.jpg', '.jpeg', '.png', '.bmp', '.tiff'))]
+            total_imgs = len(imgs)
+            if total_imgs == 0:
+                self.log_message.emit("输入目录中未找到图片 ❌")
+                self.finished_signal.emit()
+                return
+
+            # 灰度转RGB并保存临时文件
+            self.log_message.emit("开始灰度图像转RGB...此过程时间较长，请等待")
+            for img_name in imgs:
+                img_path = os.path.join(self.input_dir, img_name)
+                img = cv2.imread(img_path, cv2.IMREAD_UNCHANGED)
+                if img is None:
+                    continue
+                if len(img.shape) == 2 or img.shape[2] == 1:
+                    img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
+                cv2.imwrite(os.path.join(temp_dir, img_name), img)
+
+            # ========= 模型检测阶段 =========
+            self.log_message.emit("开始执行YOLO检测...")
+            results = []
+            for i, file in enumerate(imgs, 1):
+                temp_path = os.path.join(temp_dir, file)
+                result = model.predict(
+                    source=temp_path, conf=self.conf, save=False, classes=self.classes
+                )
+                results.extend(result)
+                progress = int(i / total_imgs * 100)
+                self.update_model_progress.emit(progress)
+                self.log_message.emit(f"[检测完成] {file}")
+
+            # ========= XML生成阶段 =========
+            self.log_message.emit("开始生成VOC格式XML...")
+            total_results = len(results)
+            for j, result in enumerate(results, 1):
+                file_name = os.path.basename(result.path)
+                image_path = os.path.join(self.input_dir, file_name)
+                img = cv2.imread(image_path)
+                if img is None:
+                    continue
+                height, width, depth = img.shape
+
+                annotation = ET.Element("annotation")
+
+                folder = ET.SubElement(annotation, "folder")
+                folder.text = os.path.basename(os.path.dirname(image_path))
+
+                filename = ET.SubElement(annotation, "filename")
+                filename.text = file_name
+
+                path = ET.SubElement(annotation, "path")
+                path.text = os.path.abspath(image_path)
+
+                source = ET.SubElement(annotation, "source")
+                database = ET.SubElement(source, "database")
+                database.text = "Unknown"
+
+                size = ET.SubElement(annotation, "size")
+                ET.SubElement(size, "width").text = str(width)
+                ET.SubElement(size, "height").text = str(height)
+                ET.SubElement(size, "depth").text = str(depth)
+
+                segmented = ET.SubElement(annotation, "segmented")
+                segmented.text = "0"
+
+                for box in result.boxes:
+                    cls = int(box.cls[0])
+                    xyxy = box.xyxy[0].tolist()
+                    xmin, ymin, xmax, ymax = map(int, xyxy)
+
+                    obj = ET.SubElement(annotation, "object")
+                    ET.SubElement(obj, "name").text = self.class_mapping.get(cls, str(cls))
+                    ET.SubElement(obj, "pose").text = "Unspecified"
+                    ET.SubElement(obj, "truncated").text = "0"
+                    ET.SubElement(obj, "difficult").text = "0"
+
+                    bndbox = ET.SubElement(obj, "bndbox")
+                    ET.SubElement(bndbox, "xmin").text = str(xmin)
+                    ET.SubElement(bndbox, "ymin").text = str(ymin)
+                    ET.SubElement(bndbox, "xmax").text = str(xmax)
+                    ET.SubElement(bndbox, "ymax").text = str(ymax)
+
+                rough_string = ET.tostring(annotation, 'utf-8')
+                reparsed = minidom.parseString(rough_string)
+                xml_str = reparsed.toprettyxml(indent="\t", encoding="utf-8").decode("utf-8")
+                xml_str = "\n".join([line for line in xml_str.splitlines() if line.strip()])
+
+                xml_path = os.path.join(self.output_xml_dir, os.path.splitext(file_name)[0] + ".xml")
+                with open(xml_path, "w", encoding="utf-8") as f:
+                    f.write(xml_str)
+
+                progress = int(j / total_results * 100)
+                self.update_xml_progress.emit(progress)
+                self.log_message.emit(f"[生成完成] {xml_path}")
+
+            self.log_message.emit("✅ 所有任务完成！")
+        except Exception as e:
+            self.log_message.emit(f"❌ 错误: {e}")
+        finally:
+            self.finished_signal.emit()
+
+
+# ========== 主界面 ==========
+class MainWindow(QWidget):
+    def __init__(self):
+        super().__init__()
+        self.setWindowTitle("YOLO 自动检测 + VOC生成工具")
+        self.resize(700, 600)
+
+        layout = QVBoxLayout()
+
+        # 模型路径
+        self.model_edit = self._add_path_selector(layout, "模型路径：")
+        # 输入文件夹
+        self.input_edit = self._add_path_selector(layout, "输入图片文件夹：")
+        # 输出文件夹
+        self.output_edit = self._add_path_selector(layout, "输出XML文件夹：")
+
+        # 置信度滑块
+        conf_layout = QHBoxLayout()
+        conf_layout.addWidget(QLabel("置信度阈值："))
+        self.conf_slider = QSlider(Qt.Horizontal)
+        self.conf_slider.setRange(0, 100)
+        self.conf_slider.setValue(20)
+        self.conf_value = QLabel("0.2")
+        self.conf_slider.valueChanged.connect(lambda v: self.conf_value.setText(str(v / 100)))
+        conf_layout.addWidget(self.conf_slider)
+        conf_layout.addWidget(self.conf_value)
+        layout.addLayout(conf_layout)
+
+        # 控制按钮
+        btn_layout = QHBoxLayout()
+        self.btn_load = QPushButton("加载模型")
+        self.btn_start = QPushButton("开始检测")
+        btn_layout.addWidget(self.btn_load)
+        btn_layout.addWidget(self.btn_start)
+        layout.addLayout(btn_layout)
+
+        # 两个进度条
+        self.progress_model = QProgressBar()
+        self.progress_model.setFormat("模型检测进度：%p%")
+        self.progress_xml = QProgressBar()
+        self.progress_xml.setFormat("XML生成进度：%p%")
+        layout.addWidget(self.progress_model)
+        layout.addWidget(self.progress_xml)
+
+        # 日志输出
+        layout.addWidget(QLabel("日志输出："))
+        self.log_output = QTextEdit()
+        self.log_output.setReadOnly(True)
+        layout.addWidget(self.log_output)
+
+        self.setLayout(layout)
+
+        # 信号绑定
+        self.btn_load.clicked.connect(self.load_model)
+        self.btn_start.clicked.connect(self.start_detection)
+
+        self.model_loaded = False
+
+    def _add_path_selector(self, layout, label_text):
+        hlayout = QHBoxLayout()
+        label = QLabel(label_text)
+        edit = QLineEdit()
+        btn = QPushButton("浏览")
+        hlayout.addWidget(label)
+        hlayout.addWidget(edit)
+        hlayout.addWidget(btn)
+        layout.addLayout(hlayout)
+        btn.clicked.connect(lambda: self._select_path(edit, "选择文件夹" if "文件夹" in label_text else "选择模型文件"))
+        return edit
+
+    def _select_path(self, edit, title):
+        if "模型" in title:
+            path, _ = QFileDialog.getOpenFileName(self, title, "", "Model Files (*.pt *.onnx)")
+        else:
+            path = QFileDialog.getExistingDirectory(self, title)
+        if path:
+            edit.setText(path)
+
+    def load_model(self):
+        model_path = self.model_edit.text().strip()
+        if not os.path.exists(model_path):
+            self._log("❌ 模型文件不存在")
+            return
+        self.model_loaded = True
+        self._log("✅ 模型路径加载成功，可开始检测")
+
+    def start_detection(self):
+        if not self.model_loaded:
+            self._log("⚠️ 请先加载模型路径")
+            return
+
+        model_path = self.model_edit.text().strip()
+        input_dir = self.input_edit.text().strip()
+        output_xml_dir = self.output_edit.text().strip()
+        conf = float(self.conf_slider.value() / 100)
+        classes = [11]  # 可修改为自定义选择
+
+        if not os.path.exists(input_dir):
+            self._log("❌ 输入文件夹不存在")
+            return
+
+        self.progress_model.setValue(0)
+        self.progress_xml.setValue(0)
+
+        self.thread = DetectionThread(model_path, input_dir, output_xml_dir, conf, classes)
+        self.thread.update_model_progress.connect(self.progress_model.setValue)
+        self.thread.update_xml_progress.connect(self.progress_xml.setValue)
+        self.thread.log_message.connect(self._log)
+        self.thread.finished_signal.connect(self._finish)
+        self.thread.start()
+
+        self.btn_start.setEnabled(False)
+        self._log("开始执行检测任务...")
+
+    def _log(self, msg):
+        self.log_output.append(msg)
+        self.log_output.verticalScrollBar().setValue(self.log_output.verticalScrollBar().maximum())
+
+    def _finish(self):
+        self.btn_start.setEnabled(True)
+        self._log("任务完成 ✅")
+
+
+# ========== 主程序入口 ==========
+if __name__ == "__main__":
+    app = QApplication(sys.argv)
+    window = MainWindow()
+    window.show()
+    sys.exit(app.exec_())
--- a/autoannoguinew.py
+++ b/autoannoguinew.py
@@ -0,0 +1,313 @@
+import os
+import cv2
+import sys
+import xml.etree.ElementTree as ET
+from xml.dom import minidom
+from ultralytics import YOLO
+from PyQt5.QtWidgets import (
+    QApplication, QWidget, QVBoxLayout, QHBoxLayout, QPushButton,
+    QLineEdit, QLabel, QFileDialog, QProgressBar, QTextEdit, QSlider,
+    QCheckBox, QScrollArea, QGroupBox, QGridLayout
+)
+from PyQt5.QtCore import Qt, QThread, pyqtSignal
+
+
+# ========== 后台任务线程 ==========
+class DetectionThread(QThread):
+    update_rgb_progress = pyqtSignal(int)
+    update_model_progress = pyqtSignal(int)
+    update_xml_progress = pyqtSignal(int)
+    log_message = pyqtSignal(str)
+    finished_signal = pyqtSignal()
+
+    def __init__(self, model_path, input_dir, output_xml_dir, temp_dir, conf, classes):
+        super().__init__()
+        self.model_path = model_path
+        self.input_dir = input_dir
+        self.output_xml_dir = output_xml_dir
+        self.temp_dir = temp_dir
+        self.conf = conf
+        self.classes = classes
+
+        # 类别映射
+        self.class_mapping = {
+            0: "EM14", 1: "EM18", 2: "EM17", 3: "EM170", 4: "EM19",
+            5: "EM190", 6: "EM20", 7: "EM200", 8: "EM201", 9: "EM202",
+            10: "EM203", 11: "EM180", 12: "EM181"
+        }
+
+    def run(self):
+        try:
+            os.makedirs(self.output_xml_dir, exist_ok=True)
+            os.makedirs(self.temp_dir, exist_ok=True)
+
+            # 加载模型
+            self.log_message.emit(f"加载模型：{self.model_path}")
+            model = YOLO(self.model_path)
+            self.log_message.emit("模型加载完成 ✅")
+
+            # 读取图片
+            imgs = [f for f in os.listdir(self.input_dir)
+                    if f.lower().endswith(('.jpg', '.jpeg', '.png', '.bmp', '.tiff'))]
+            total_imgs = len(imgs)
+            if total_imgs == 0:
+                self.log_message.emit("输入目录中未找到图片 ❌")
+                self.finished_signal.emit()
+                return
+
+            # ========= 灰度转RGB阶段 =========
+            self.log_message.emit("开始灰度图像转RGB...此过程时间较长，请等待")
+            for i, img_name in enumerate(imgs, 1):
+                img_path = os.path.join(self.input_dir, img_name)
+                img = cv2.imread(img_path, cv2.IMREAD_UNCHANGED)
+                if img is None:
+                    continue
+                if len(img.shape) == 2 or img.shape[2] == 1:
+                    img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
+                cv2.imwrite(os.path.join(self.temp_dir, img_name), img)
+                self.update_rgb_progress.emit(int(i / total_imgs * 100))
+            self.log_message.emit("RGB 转换完成 ✅")
+
+            # ========= 模型检测阶段 =========
+            self.log_message.emit("开始执行YOLO检测...")
+            results = []
+            for i, file in enumerate(imgs, 1):
+                temp_path = os.path.join(self.temp_dir, file)
+                result = model.predict(
+                    source=temp_path, conf=self.conf, save=False,
+                    classes=self.classes if self.classes else None
+                )
+                results.extend(result)
+                self.update_model_progress.emit(int(i / total_imgs * 100))
+                self.log_message.emit(f"[检测完成] {file}")
+
+            # ========= XML生成阶段 =========
+            self.log_message.emit("开始生成VOC格式XML...")
+            total_results = len(results)
+            for j, result in enumerate(results, 1):
+                file_name = os.path.basename(result.path)
+                image_path = os.path.join(self.input_dir, file_name)
+                img = cv2.imread(image_path)
+                if img is None:
+                    continue
+                height, width, depth = img.shape
+
+                annotation = ET.Element("annotation")
+
+                folder = ET.SubElement(annotation, "folder")
+                folder.text = os.path.basename(os.path.dirname(image_path))
+
+                filename = ET.SubElement(annotation, "filename")
+                filename.text = file_name
+
+                path = ET.SubElement(annotation, "path")
+                path.text = os.path.abspath(image_path)
+
+                source = ET.SubElement(annotation, "source")
+                database = ET.SubElement(source, "database")
+                database.text = "Unknown"
+
+                size = ET.SubElement(annotation, "size")
+                ET.SubElement(size, "width").text = str(width)
+                ET.SubElement(size, "height").text = str(height)
+                ET.SubElement(size, "depth").text = str(depth)
+
+                segmented = ET.SubElement(annotation, "segmented")
+                segmented.text = "0"
+
+                for box in result.boxes:
+                    cls = int(box.cls[0])
+                    xyxy = box.xyxy[0].tolist()
+                    xmin, ymin, xmax, ymax = map(int, xyxy)
+
+                    obj = ET.SubElement(annotation, "object")
+                    ET.SubElement(obj, "name").text = self.class_mapping.get(cls, str(cls))
+                    ET.SubElement(obj, "pose").text = "Unspecified"
+                    ET.SubElement(obj, "truncated").text = "0"
+                    ET.SubElement(obj, "difficult").text = "0"
+
+                    bndbox = ET.SubElement(obj, "bndbox")
+                    ET.SubElement(bndbox, "xmin").text = str(xmin)
+                    ET.SubElement(bndbox, "ymin").text = str(ymin)
+                    ET.SubElement(bndbox, "xmax").text = str(xmax)
+                    ET.SubElement(bndbox, "ymax").text = str(ymax)
+
+                xml_str = minidom.parseString(ET.tostring(annotation, 'utf-8')).toprettyxml(indent="\t", encoding="utf-8").decode("utf-8")
+                xml_str = "\n".join([line for line in xml_str.splitlines() if line.strip()])
+
+                xml_path = os.path.join(self.output_xml_dir, os.path.splitext(file_name)[0] + ".xml")
+                with open(xml_path, "w", encoding="utf-8") as f:
+                    f.write(xml_str)
+
+                self.update_xml_progress.emit(int(j / total_results * 100))
+                self.log_message.emit(f"[生成完成] {xml_path}")
+
+            self.log_message.emit("✅ 所有任务完成！")
+        except Exception as e:
+            self.log_message.emit(f"❌ 错误: {e}")
+        finally:
+            self.finished_signal.emit()
+
+
+# ========== 主界面 ==========
+class MainWindow(QWidget):
+    def __init__(self):
+        super().__init__()
+        self.setWindowTitle("YOLO 半自动标注工具（华东专用）")
+        self.resize(750, 750)
+
+        layout = QVBoxLayout()
+
+        # 路径部分
+        self.model_edit = self._add_path_selector(layout, "模型路径：")
+        self.input_edit = self._add_path_selector(layout, "输入图片文件夹：")
+        self.output_edit = self._add_path_selector(layout, "输出XML文件夹：")
+        self.temp_edit = self._add_path_selector(layout, "临时RGB图片文件夹：")
+
+        # 置信度
+        conf_layout = QHBoxLayout()
+        conf_layout.addWidget(QLabel("置信度阈值："))
+        self.conf_slider = QSlider(Qt.Horizontal)
+        self.conf_slider.setRange(0, 100)
+        self.conf_slider.setValue(20)
+        self.conf_value = QLabel("0.2")
+        self.conf_slider.valueChanged.connect(lambda v: self.conf_value.setText(str(v / 100)))
+        conf_layout.addWidget(self.conf_slider)
+        conf_layout.addWidget(self.conf_value)
+        layout.addLayout(conf_layout)
+
+        # 类别选择区域
+        self.class_mapping = {
+            0: "EM14", 1: "EM18", 2: "EM17", 3: "EM170", 4: "EM19",
+            5: "EM190", 6: "EM20", 7: "EM200", 8: "EM201", 9: "EM202",
+            10: "EM203", 11: "EM180", 12: "EM181"
+        }
+
+        layout.addWidget(QLabel("选择要检测的类别（可多选）："))
+        self.class_checkboxes = {}
+        class_group = QGroupBox()
+        grid = QGridLayout()
+        for idx, (key, name) in enumerate(self.class_mapping.items()):
+            cb = QCheckBox(f"{key}: {name}")
+            self.class_checkboxes[key] = cb
+            grid.addWidget(cb, idx // 4, idx % 4)
+        class_group.setLayout(grid)
+
+        scroll = QScrollArea()
+        scroll.setWidget(class_group)
+        scroll.setWidgetResizable(True)
+        scroll.setFixedHeight(120)
+        layout.addWidget(scroll)
+
+        # 控制按钮
+        btn_layout = QHBoxLayout()
+        self.btn_load = QPushButton("加载模型")
+        self.btn_start = QPushButton("开始检测")
+        btn_layout.addWidget(self.btn_load)
+        btn_layout.addWidget(self.btn_start)
+        layout.addLayout(btn_layout)
+
+        # 三个进度条
+        self.progress_rgb = QProgressBar()
+        self.progress_rgb.setFormat("RGB转换进度：%p%")
+        self.progress_model = QProgressBar()
+        self.progress_model.setFormat("模型检测进度：%p%")
+        self.progress_xml = QProgressBar()
+        self.progress_xml.setFormat("XML生成进度：%p%")
+        layout.addWidget(self.progress_rgb)
+        layout.addWidget(self.progress_model)
+        layout.addWidget(self.progress_xml)
+
+        # 日志
+        layout.addWidget(QLabel("日志输出："))
+        self.log_output = QTextEdit()
+        self.log_output.setReadOnly(True)
+        layout.addWidget(self.log_output)
+
+        self.setLayout(layout)
+
+        # 信号绑定
+        self.btn_load.clicked.connect(self.load_model)
+        self.btn_start.clicked.connect(self.start_detection)
+        self.model_loaded = False
+
+    def _add_path_selector(self, layout, label_text):
+        hlayout = QHBoxLayout()
+        label = QLabel(label_text)
+        edit = QLineEdit()
+        btn = QPushButton("浏览")
+        hlayout.addWidget(label)
+        hlayout.addWidget(edit)
+        hlayout.addWidget(btn)
+        layout.addLayout(hlayout)
+        btn.clicked.connect(lambda: self._select_path(edit, "选择文件夹" if "文件夹" in label_text else "选择模型文件"))
+        return edit
+
+    def _select_path(self, edit, title):
+        if "模型" in title:
+            path, _ = QFileDialog.getOpenFileName(self, title, "", "Model Files (*.pt *.onnx)")
+        else:
+            path = QFileDialog.getExistingDirectory(self, title)
+        if path:
+            edit.setText(path)
+
+    def load_model(self):
+        path = self.model_edit.text().strip()
+        if not os.path.exists(path):
+            self._log("❌ 模型文件不存在")
+            return
+        self.model_loaded = True
+        self._log("✅ 模型路径加载成功，可开始检测")
+
+    def start_detection(self):
+        if not self.model_loaded:
+            self._log("⚠️ 请先加载模型路径")
+            return
+
+        model_path = self.model_edit.text().strip()
+        input_dir = self.input_edit.text().strip()
+        output_xml_dir = self.output_edit.text().strip()
+        temp_dir = self.temp_edit.text().strip()
+        conf = float(self.conf_slider.value() / 100)
+
+        selected_classes = [cid for cid, cb in self.class_checkboxes.items() if cb.isChecked()]
+
+        self._log(f"选中类别：{selected_classes if selected_classes else '全部'}")
+
+        if not os.path.exists(input_dir):
+            self._log("❌ 输入文件夹不存在")
+            return
+        if not temp_dir:
+            self._log("⚠️ 请选择临时RGB图片文件夹")
+            return
+
+        self.progress_rgb.setValue(0)
+        self.progress_model.setValue(0)
+        self.progress_xml.setValue(0)
+
+        self.thread = DetectionThread(model_path, input_dir, output_xml_dir, temp_dir, conf, selected_classes)
+        self.thread.update_rgb_progress.connect(self.progress_rgb.setValue)
+        self.thread.update_model_progress.connect(self.progress_model.setValue)
+        self.thread.update_xml_progress.connect(self.progress_xml.setValue)
+        self.thread.log_message.connect(self._log)
+        self.thread.finished_signal.connect(self._finish)
+        self.thread.start()
+
+        self.btn_start.setEnabled(False)
+        self._log("开始执行检测任务...")
+
+    def _log(self, msg):
+        self.log_output.append(msg)
+        self.log_output.verticalScrollBar().setValue(self.log_output.verticalScrollBar().maximum())
+
+    def _finish(self):
+        self.btn_start.setEnabled(True)
+        self._log("任务完成 ✅")
+
+
+# ========== 主程序入口 ==========
+if __name__ == "__main__":
+    app = QApplication(sys.argv)
+    window = MainWindow()
+    window.show()
+    sys.exit(app.exec_())
--- a/autoannoguinew.spec
+++ b/autoannoguinew.spec
@@ -0,0 +1,44 @@
+# -*- mode: python ; coding: utf-8 -*-
+
+
+a = Analysis(
+    ['autoannoguinew.py'],
+    pathex=['D:\PythonProject\AutoAnno\.venv\Lib\site-packages'],
+    binaries=[],
+    datas=[],
+    hiddenimports=['os','cv2','ultralytics','PyQt5','sys','xml.etree.ElementTree','xml.dom'],
+    hookspath=[],
+    hooksconfig={},
+    runtime_hooks=[],
+    excludes=[],
+    noarchive=False,
+    optimize=0,
+)
+pyz = PYZ(a.pure)
+
+exe = EXE(
+    pyz,
+    a.scripts,
+    [],
+    exclude_binaries=True,
+    name='autoannoguinew',
+    debug=False,
+    bootloader_ignore_signals=False,
+    strip=False,
+    upx=True,
+    console=True,
+    disable_windowed_traceback=False,
+    argv_emulation=False,
+    target_arch=None,
+    codesign_identity=None,
+    entitlements_file=None,
+)
+coll = COLLECT(
+    exe,
+    a.binaries,
+    a.datas,
+    strip=False,
+    upx=True,
+    upx_exclude=[],
+    name='autoannoguinew',
+)
--- a/epoch220(1).pt
+++ b/epoch220(1).pt
--- a/function-gpu.yaml
+++ b/function-gpu.yaml
@@ -0,0 +1,68 @@
+metadata:
+  name: emdetector
+  namespace: cvat
+  annotations:
+    name: EM14 v1
+    type: detector
+    framework: pytorch
+    spec: |
+      [
+        { "id": 0, "name": "EM14", "type": "rectangle" },
+        { "id": 1, "name": "EM18", "type": "rectangle" },
+        { "id": 2, "name": "EM17", "type": "rectangle" },
+        { "id": 3, "name": "EM170", "type": "rectangle" },
+        { "id": 4, "name": "EM19", "type": "rectangle" },
+        { "id": 5, "name": "EM190", "type": "rectangle" },
+        { "id": 6, "name": "EM20", "type": "rectangle" },
+        { "id": 7, "name": "EM200", "type": "rectangle" },
+        { "id": 8, "name": "EM201", "type": "rectangle" },
+        { "id": 9, "name": "EM202", "type": "rectangle" },
+        { "id": 10, "name": "EM203", "type": "rectangle" }
+      ]      
+
+spec:
+  description: 工位检测
+  runtime: "python:3.9"
+  handler: main:handler
+  eventTimeout: 30s
+
+  build:
+    image: cvat.pth.yolo8.emdetector:latest-gpu
+    baseImage: python:3.9
+    directives:
+      preCopy:
+        - kind: ENV
+          value: DEBIAN_FRONTEND=noninteractive
+        - kind: RUN
+          value: apt-get update && apt-get install -y libgl1 libglib2.0-0 && apt-get clean
+        - kind: RUN
+          value: pip install ultralytics torch torchvision opencv-python-headless && pip cache purge
+
+  triggers:
+    myHttpTrigger:
+      numWorkers: 1
+      kind: 'http'
+      workerAvailabilityTimeoutMilliseconds: 10000
+      attributes:
+        # Set value from the calculation of tracking of 100 objects at the same time on a 4k image
+        maxRequestBodySize: 268435456 # 256MB
+
+  volumes:
+    - volume:
+        name: model-volume
+        hostPath:
+          path: /DATA/wjl/cvat/models/best.pt  # 可选：如果使用HostPath挂载模型
+      volumeMount:
+        name: model-volume
+        mountPath: /opt/nuclio/best.pt
+
+  resources:
+    limits:
+      nvidia.com/gpu: 1
+
+  platform:
+    attributes:
+      restartPolicy:
+        name: always
+        maximumRetryCount: 3
+      mountMode: volume
--- a/localdetect.py
+++ b/localdetect.py
@@ -0,0 +1,38 @@
+import os
+import cv2
+from ultralytics import YOLO
+
+# 加载模型
+model = YOLO("best.pt")
+
+# 输入文件夹路径
+input_dir = "test_images/"
+temp_dir = "temp_rgb_images"
+
+# 创建临时文件夹用于保存转换后的RGB图片
+os.makedirs(temp_dir, exist_ok=True)
+
+# 扫描文件夹，将灰度图转换为RGB
+for file in os.listdir(input_dir):
+    if file.lower().endswith(('.jpg', '.jpeg', '.png', '.bmp', '.tiff')):
+        path = os.path.join(input_dir, file)
+        img = cv2.imread(path, cv2.IMREAD_UNCHANGED)
+
+        # 如果是灰度图，转换为3通道
+        if len(img.shape) == 2 or img.shape[2] == 1:
+            img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
+
+        # 保存到临时目录
+        cv2.imwrite(os.path.join(temp_dir, file), img)
+
+# 使用转换后的图像文件夹进行检测
+results = model.predict(source=temp_dir, conf=0.2, save=True)
+
+# 输出检测信息
+for result in results:
+    boxes = result.boxes  # 检测框
+    for box in boxes:
+        cls = int(box.cls[0])
+        conf = float(box.conf[0])
+        xyxy = box.xyxy[0].tolist()
+        print(f"类别: {model.names[cls]}, 置信度: {conf:.2f}, 坐标: {xyxy}")
--- a/main.py
+++ b/main.py
@@ -0,0 +1,24 @@
+import json
+import base64
+# from PIL import Image
+import io
+from model_handler import ModelHandler
+
+def init_context(context):
+    context.logger.info("Init context...  0%")
+
+    context.logger.info("Initializing EMDetection model...")
+    context.user_data.model_handler = ModelHandler()
+
+    context.logger.info("Init context...100%")
+
+def handler(context, event):
+    context.logger.info("Run EMDetection model")
+    data = event.body
+    image_data = base64.b64decode(data["image"])
+    threshold = float(data.get("threshold", 0.5))
+
+    results = context.user_data.model_handler.infer(image_data, threshold)
+
+    return context.Response(body=json.dumps(results), headers={},
+        content_type='application/json', status_code=200)
--- a/model_handler.py
+++ b/model_handler.py
@@ -0,0 +1,33 @@
+import io
+from PIL import Image
+from ultralytics import YOLO
+
+
+class ModelHandler:
+    def __init__(self):
+        """加载 YOLOv11 模型"""
+        self.model = YOLO("/opt/nuclio/best.pt")  # 确保路径正确
+
+    def infer(self, image_data, threshold=0.3):
+        """
+        执行推理
+        :param image_data: 图片的二进制数据
+        :param threshold: 置信度阈值（默认0.3）
+        :return: 符合阈值的检测结果
+        """
+        image = Image.open(io.BytesIO(image_data))
+        results = self.model(image)
+
+        detections = []
+        for result in results:
+            for box in result.boxes.data.tolist():
+                x1, y1, x2, y2, score, class_id = box
+                if score >= threshold:  # 过滤低置信度目标
+                    detections.append({
+                        "confidence": score,
+                        "label": self.model.names[int(class_id)],
+                        "points": [x1, y1, x2, y2],
+                        "type": "rectangle",
+                    })
+
+        return detections
--- a/runanno.py
+++ b/runanno.py
@@ -0,0 +1,16 @@
+import subprocess
+import os
+
+# 获取当前脚本所在的目录（即 AutoAnno 目录）
+base_dir = os.path.dirname(os.path.abspath(__file__))
+
+# 组装相对路径
+python_exe = os.path.join(base_dir, ".venv", "Scripts", "python.exe")
+script_path = os.path.join(base_dir, "autoannoguinew.py")
+
+# 后台静默执行
+subprocess.Popen(
+    [python_exe, script_path],
+    creationflags=subprocess.CREATE_NO_WINDOW,
+    cwd=base_dir
+)