Post List

# Transformers-Part1 Attention is All your Need 最近服务器大量跑计算,正好有时间,把这个非常出名的 Transformers 好好看看,结果就发现他过于抽象,还是归因于自己对于 python 的类、实例、函数认识不清,对于 Torch 还有深度学习基础架构不熟悉。趁这个机会正好好好学习一下。主要就是首先简单记录一下 Transformers 的基础架构,再深入看看基于 Torch 的 Transformers 源码。文中肯定是有纰漏的,有缘人看到请帮忙指正… # Transformers...

# hexo + github 配置 之前用 readthedoc 感觉体验不好,又看到了 https://shoka.lostyu.me/computer-science/note/theme-shoka-doc/ 大佬的博客页面,本二次元跃跃欲试,就直接冲! # 安装 hexo hexo 基于 node.js,使用 npm 安装 123456npm install -g hexo-climkdir /path/to/hexo/root/dir/hexo init /path/to/hexo/root/dir/ # 初始化cd /path/to/hexo/root/dir/npm...

# readthedocs # 配置总结 注册账号 (略) 本地构建 基于 python 3.12 123456# 安装Sphinx(必须)pip3 install -U Sphinxmkdir my_readthedocscd my_readthedocssphinx-quickstart # 直接键入命令行make html 一路回车,可选项见参考 更改主题(可选) 1pip3 install sphinx_rtd_theme md 支持(可选) 1pip3 install recommonmark 配置...

# git # 一些常用的 git 还有踩过的坑 配置用户名与邮箱,用户名与 git 账号相同,邮箱类似。 在最开始配置即可,后面就不用二次配置,可更改(坑 + 1) 12git config --global user.name "GitHub用户名"git config --global user.email "注册GitHub用的邮箱" ssh key 1ssh-keygen -t rsa -C "注册GitHub用的邮箱" 生成 ssh key,需要在账户中的...

# Tau Evolution of tissue-specific expression of ancestral genes across vertebrates and insects 中计算组织特异表达基因提到了一个参数 Tau ,文中参考文献 Genome-wide midrange transcription profiles reveal expression level relationships in human tissue specification. ,就来瞅一眼到底是个什么。 # 定义 \tau$$(Tau)定义为: \tau =...

# 稀疏偏最小二乘判别分析(sPLS-DA) 阅读文章 Evolution of tissue-specific expression of ancestral genes across vertebrates and insects 看到这么一个分析,用来找到组织特异性的表达模块,立马就想学习一下(CSDN 开抄) # PLS-DA PLS-DA (Partial Least Squares Discriminant Analysis),即偏最小二乘法判别分析,是多变量数据分析技术中的判别分析法,经常用来处理分类和判别问题。通过对主成分适当的旋转,PLS-DA...

# PCMs (Phylogenetic comparative methods) 系统发育比较方法(PCM)旨在分析系统发育框架中物种性状的数据集。它们用于各种目的,包括检测选择,测量性状进化的速率,估计祖先性状,控制多物种数据的系统发育相互依赖性,估计协变量对特征的影响。 # 手写 MCMC MCMC 用于 https://lukejharmon.github.io/pcm/chapter2_stats / 中的 2.4b 参数推断(为什么手写呢,我也觉得很奇怪) Metropolis-Hastings 采样算法 初始化时间 t=1 设置𝑢的值,并初始化初始状态...

# DeepBSA 流程 记录一下我装 DeepBSA 的流程。 首先想尝试使用 singularity 镜像,就还是使用了 miniconda3_base.sif 的镜像。 使用 yaml 去装: 123456789101112131415name: deepbsachannels: - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main -...

# GWAS 这两天开始折腾 GWAS,又翻了翻 GWAS 的原理,好多都不懂,记录一下自己的心路历程。 这次参考了 Zhou (2022) 番茄图泛基因组的 GWAS 流程 YaoZhou89/TGG: tomato graph pangenome,使用了 MLM模型 与 LOCO (Leava one choromosome out) 的方法。流程主要是 LDAK计算亲缘关系矩阵 + gcta进行GWAS分析 ,一上来直接给我干懵了,这里记录一下我这两天折腾的过程,对这次的分析流程的部分原理进行介绍。 # MLM Yu 等在玉米中使用 MLM 的模型,向 GWAS 模型中纳入了...

# VAE VAE(变分自编码器, Variational Autoencoders),生成式模型 看明白 VAE 需要了解降维的概念,以 PCA 作为例子,并展示 VAE 与 PCA 之间的关系。 # 降维 # 什么是降维? 在机器学习中,降维是减少描述数据的特征数量的过程。可以通过选择(仅保留一些现有特征)或通过提取(基于旧特征组合来生成数量更少的新特征)来进行降维。降维在许多需要低维数据的场景中很有用。尽管有许多不同的降维方法,但是我们可以构建一个适用于大多数方法的总体框架。 首先,我们称编码器(Encoder)为从 “旧特征” 表示中产生 “新特征”...