業務介紹
1. 高通量組學全流程數據分析
-
原始數據質控
- 自動化質控流程:整合 FastQC 和 MultiQC;基於機器學習的異常樣本檢測。
- 輸出詳細報告,提供改進建議。
-
序列比對與定量
- 支持 RNA-seq(Hisat2、STAR)、DNA-seq(BWA、Bowtie2)等主流工具,優化參數並行化調度。
- C++ 重構版序列比對核心,適用於大規模測序數據。
-
差異表達與功能註釋
- 差異基因篩選:DESeq2、edgeR,結合自主研發的批次效應校正模組。
- 富集分析:GO、KEGG、Reactome,多數據庫交叉比對。
-
單細胞組學與空間轉錄組
- 單細胞數據預處理:Cell Ranger、Scanpy、Seurat。
- 細胞亞群識別與發育軌跡:Monocle、PAGA。
- 空間轉錄組整合分析及可視化展示。
-
多組學數據整合
- 採用多視圖學習與網絡生物學方法:MOFA、DIABLO。
- 構建基因–蛋白與代謝通路網絡,挖掘潛在生物標誌物。
2. 平台與軟體工程服務
-
分析流程自動化
- 基於 Nextflow、Snakemake 的可重現管道開發,支持容器化(Docker/Singularity)。
- 集群調度與雲平台部署(AWS、阿里雲、華為雲)。
-
Web 互動與可視化系統
- 前端:Vue.js、React,提供互動式圖表(ECharts、Plotly)。
- 後端:Python Django/Flask、Node.js + Express。
- 資料庫:MySQL、PostgreSQL、MongoDB,支持大規模時序資料存儲。
-
知識庫與知識圖譜
- 構建結構化知識圖譜:基因–疾病–藥物關係網。
- 自主研發知識推理引擎,支持自然語言查詢。
-
C++ 工具重構與加速
- 對關鍵算法(序列比對、聚類、網絡分析)進行底層優化。
- 支持 GPU 加速(CUDA)、多線程與 SIMD 指令集。
3. 生物安全與生物情報支持
-
合成生物安全檢測
- 自動化 DNA 序列風險掃描:毒性基因、抗性基因、致病島檢測。
- 自主研發生物威脅預測模型,結合文獻挖掘與實驗驗證數據。
-
政策諮詢與技術評審
- 為政府監管部門提供生物安全政策建議與技術可行性報告。
- 協助合成生物企業進行風險評估與合規審查。
-
應急監測與預警
- 開發即時監測平台,接入公共資料庫與實驗數據,自動觸發安全預警。
- 支持全球序列資料庫對接與跨區域疫情監測。
4. 學術與培訓支持
-
課題設計與專案申請
- 協助撰寫基金申請書,設計合理的實驗與數據分析方案。
- 提供樣本量計算與統計設計建議。
-
科研論文輔導
- 結果可視化:高質量圖表製作(ggplot2、Plotly)。
-
技術培訓與工作坊
- Python/R 生物資訊學實戰課程。
- 深度學習與組學分析專題講座。
- 線上直播與線下培訓結合。