介绍

1. 概述

ML-QTL 是一个基于机器学习的 QTL 挖掘工具,以回归模型预测表型的能力为依据,对全基因组 SNP 与表型之间的关联显著性进行评估,并结合滑动窗口算法精准定位候选 QTL 区域。该工具以 Python 包形式发布,适用于表型关联基因的高效挖掘与分子育种研究。

2. 功能

  • 使用 plink 二进制文件格式的基因型文件,能够高效处理大规模基因组数据

  • 支持多种回归模型(默认使用决策树回归、随机森林回归和支持向量回归)

  • 生成滑动窗口预测结果,输出预测结果并作图

  • 计算基因内SNP的重要性

  • 支持多进程并行

  • 提供命令行界面和Python API两种使用方式

3. 安装

3.1 使用pip安装

在安装之前,推荐先创建一个虚拟环境,以避免与其他项目的依赖冲突(可选)

python -m venv venv
source venv/bin/activate

从pypi安装包

pip install mlqtl

# 使用国内镜像源
pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple mlqtl

注意

numpy从2.3.0开始不再对Glibc 2.28以下的Linux系统提供二进制包,链接 。因此如果你使用的是较旧的Linux系统,需要安装更低的numpy版本

如果你遇到安装问题,可以尝试以下方法:

# 强制安装numpy的二进制wheel包
pip install mlqtl --only-binary=numpy

# 或者安装numpy的特定版本
pip install numpy==2.2.6 mlqtl

3.2 使用源码安装

  1. 下载源代码

# 从github克隆代码库
git clone https://github.com/huanglab-cbi/mlqtl.git

# 从我们的网站下载
wget https://cbi.njau.edu.cn/mlqtl/download/source_code.tar.gz
  1. 切换到代码目录

cd mlqtl
  1. 安装依赖

pip install -r requirements.txt
  1. 构建包

pip install build
python -m build
  1. 安装包

pip install dist/mlqtl-{version}-py3-none-any.whl

3.3 使用预构建的文件

如果你使用的操作系统是Windows并且没有安装Python,可以使用预编译的二进制包。请访问我们的 下载页面 获取最新版本。

下载后,解压缩到任意目录,然后在CMD或PowerShell中运行以下命令:

mlqtl.exe --help