業務介紹

1. 高通量組學全流程數據分析

原始數據質控
- 自動化質控流程：整合 FastQC 和 MultiQC；基於機器學習的異常樣本檢測。
- 輸出詳細報告，提供改進建議。
序列比對與定量
- 支持 RNA-seq（Hisat2、STAR）、DNA-seq（BWA、Bowtie2）等主流工具，優化參數並行化調度。
- C++ 重構版序列比對核心，適用於大規模測序數據。
差異表達與功能註釋
- 差異基因篩選：DESeq2、edgeR，結合自主研發的批次效應校正模組。
- 富集分析：GO、KEGG、Reactome，多數據庫交叉比對。
單細胞組學與空間轉錄組
- 單細胞數據預處理：Cell Ranger、Scanpy、Seurat。
- 細胞亞群識別與發育軌跡：Monocle、PAGA。
- 空間轉錄組整合分析及可視化展示。
多組學數據整合
- 採用多視圖學習與網絡生物學方法：MOFA、DIABLO。
- 構建基因–蛋白與代謝通路網絡，挖掘潛在生物標誌物。

2. 平台與軟體工程服務

分析流程自動化
- 基於 Nextflow、Snakemake 的可重現管道開發，支持容器化（Docker/Singularity）。
- 集群調度與雲平台部署（AWS、阿里雲、華為雲）。
Web 互動與可視化系統
- 前端：Vue.js、React，提供互動式圖表（ECharts、Plotly）。
- 後端：Python Django/Flask、Node.js + Express。
- 資料庫：MySQL、PostgreSQL、MongoDB，支持大規模時序資料存儲。
知識庫與知識圖譜
- 構建結構化知識圖譜：基因–疾病–藥物關係網。
- 自主研發知識推理引擎，支持自然語言查詢。
C++ 工具重構與加速
- 對關鍵算法（序列比對、聚類、網絡分析）進行底層優化。
- 支持 GPU 加速（CUDA）、多線程與 SIMD 指令集。

3. 生物安全與生物情報支持

合成生物安全檢測
- 自動化 DNA 序列風險掃描：毒性基因、抗性基因、致病島檢測。
- 自主研發生物威脅預測模型，結合文獻挖掘與實驗驗證數據。
政策諮詢與技術評審
- 為政府監管部門提供生物安全政策建議與技術可行性報告。
- 協助合成生物企業進行風險評估與合規審查。
應急監測與預警
- 開發即時監測平台，接入公共資料庫與實驗數據，自動觸發安全預警。
- 支持全球序列資料庫對接與跨區域疫情監測。

4. 學術與培訓支持

課題設計與專案申請
- 協助撰寫基金申請書，設計合理的實驗與數據分析方案。
- 提供樣本量計算與統計設計建議。
科研論文輔導
- 結果可視化：高質量圖表製作（ggplot2、Plotly）。
技術培訓與工作坊
- Python/R 生物資訊學實戰課程。
- 深度學習與組學分析專題講座。
- 線上直播與線下培訓結合。