• OmniParser 2 屏幕解析模型

    Windows篇

Windows安装 OmniParser 2 屏幕解析模型

一、环境准备

1.安装 Python 建议使用版本:3.12

2.安装 Anaconda

winget install --Id Anaconda.Anaconda3
  • 添加环境变量:C:\Users\你的用户名\anaconda3\condabin

二、安装步骤

1.克隆项目

git clone <https://github.com/microsoft/OmniParser>
cd OmniParser

2.创建conda环境

conda create -n "omni" python==3.12
conda activate omni
pip install -r requirements.txt

3.下载视觉模型

git clone <https://huggingface.co/microsoft/OmniParser-v2.0> weights

4.修改模型路径

"microsoft/Florence-2-base"  # 或huggingface其他模型

5.启动演示

python .\\gradio_demo.py

三、注意事项

1.确保已安装CUDA驱动(未安装则默认使用CPU)
2.AMD显卡需确认ROCm环境配置
3.如遇路径错误,建议使用绝对路径
4.建议通过conda单独安装PyTorch:

conda install pytorch torchvision torchaudio -c pytorch

四、Doiiars汇总文档与原文档差异说明

1.移除了冗余的clean命令(实测安装过程无需清理)
2.补充了AMD显卡的注意事项
3.添加了PyTorch独立安装建议
4.优化了路径说明,避免环境变量错误

遇到问题可优先检查:

  • conda环境是否激活
  • CUDA/cuDNN版本兼容性
  • 模型文件是否完整下载(约3.5GB)

五、参考视频

本地部署OmniParser微软最强开源屏幕解析模型

OmniParser:微软发布截屏解析器

微软OmniParser - 屏幕解析模型本地安装指南

4
0