Foldseek快速蛋白质结构比对
1. 下载和安装 Foldseek
如果只是单个蛋白质结构的序列比对,我们只需要用Foldseek 的网站服务 https://search.foldseek.com/search 上传我们的蛋白质结构并选择想要进行比对的数据库即可,这里不做重点讲解。做生物信息学研究,我们难免需要批量对多个目标蛋白进行大规模结构比对,这需要我们下载安装本地版软件。Foldseek 有Linux 和 MacOS 二个版本的本地软件 (这边墙裂建议还在用 windows 的小伙伴搞个 Linux 或者 mac,这样做生物信息才更得心应手)。主要的安装途径如下:
# Linux AVX2 build (check using: cat /proc/cpuinfo | grep avx2)
wget https://mmseqs.com/foldseek/foldseek-linux avx2.tar.gz;
tar xvzf foldseek-linux-avx2.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Linux SSE2 build (check using: cat /proc/cpuinfo | grep sse2)
wget https://mmseqs.com/foldseek/foldseek-linux-sse2.tar.gz;
tar xvzf foldseek-linux-sse2.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Linux ARM64 build
wget https://mmseqs.com/foldseek/foldseek-linux-arm64.tar.gz;
tar xvzf foldseek-linux-arm64.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# MacOS
wget https://mmseqs.com/foldseek/foldseek-osx-universal.tar.gz;
tar xvzf foldseek-osx-universal.tar.gz;
export PATH=$(pwd)/foldseek/bin/:$PATH
# Conda installer (Linux and macOS)
conda install -c conda-forge -c bioconda foldseek
下载完了软件之后,并不需要特别的安装,只需要把 ./foldseek/bin 添加到工作路径就可以直接调用 foldseek.