介绍
1. 概述
ML-QTL
是一个基于机器学习的 QTL 挖掘工具,以回归模型预测表型的能力为依据,对全基因组 SNP 与表型之间的关联显著性进行评估,并结合滑动窗口算法精准定位候选 QTL 区域。该工具以 Python 包形式发布,适用于表型关联基因的高效挖掘与分子育种研究。
2. 功能
使用
plink
二进制文件格式的基因型文件,能够高效处理大规模基因组数据支持多种回归模型(默认使用决策树回归、随机森林回归和支持向量回归)
生成滑动窗口预测结果,输出预测结果并作图
计算基因内SNP的重要性
支持多进程并行
提供命令行界面和Python API两种使用方式
3. 安装
3.1 使用pip安装
在安装之前,推荐先创建一个虚拟环境,以避免与其他项目的依赖冲突(可选)
python -m venv venv
source venv/bin/activate
从pypi安装包
pip install mlqtl
# 使用国内镜像源
pip install -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple mlqtl
注意
numpy从2.3.0开始不再对Glibc 2.28以下的Linux系统提供二进制包,链接 。因此如果你使用的是较旧的Linux系统,需要安装更低的numpy版本
如果你遇到安装问题,可以尝试以下方法:
# 强制安装numpy的二进制wheel包
pip install mlqtl --only-binary=numpy
# 或者安装numpy的特定版本
pip install numpy==2.2.6 mlqtl
3.2 使用源码安装
下载源代码
# 从github克隆代码库
git clone https://github.com/huanglab-cbi/mlqtl.git
# 从我们的网站下载
wget https://cbi.njau.edu.cn/mlqtl/download/source_code.tar.gz
切换到代码目录
cd mlqtl
安装依赖
pip install -r requirements.txt
构建包
pip install build
python -m build
安装包
pip install dist/mlqtl-{version}-py3-none-any.whl
3.3 使用预构建的文件
如果你使用的操作系统是Windows并且没有安装Python,可以使用预编译的二进制包。请访问我们的 下载页面 获取最新版本。
下载后,解压缩到任意目录,然后在CMD或PowerShell中运行以下命令:
mlqtl.exe --help