業務介紹




1. 高通量組學全流程數據分析

  • 原始數據質控
    • 自動化質控流程:整合 FastQC 和 MultiQC;基於機器學習的異常樣本檢測。
    • 輸出詳細報告,提供改進建議。
  • 序列比對與定量
    • 支持 RNA-seq(Hisat2、STAR)、DNA-seq(BWA、Bowtie2)等主流工具,優化參數並行化調度。
    • C++ 重構版序列比對核心,適用於大規模測序數據。
  • 差異表達與功能註釋
    • 差異基因篩選:DESeq2、edgeR,結合自主研發的批次效應校正模組。
    • 富集分析:GO、KEGG、Reactome,多數據庫交叉比對。
  • 單細胞組學與空間轉錄組
    • 單細胞數據預處理:Cell Ranger、Scanpy、Seurat。
    • 細胞亞群識別與發育軌跡:Monocle、PAGA。
    • 空間轉錄組整合分析及可視化展示。
  • 多組學數據整合
    • 採用多視圖學習與網絡生物學方法:MOFA、DIABLO。
    • 構建基因–蛋白與代謝通路網絡,挖掘潛在生物標誌物。

2. 平台與軟體工程服務

  • 分析流程自動化
    • 基於 Nextflow、Snakemake 的可重現管道開發,支持容器化(Docker/Singularity)。
    • 集群調度與雲平台部署(AWS、阿里雲、華為雲)。
  • Web 互動與可視化系統
    • 前端:Vue.js、React,提供互動式圖表(ECharts、Plotly)。
    • 後端:Python Django/Flask、Node.js + Express。
    • 資料庫:MySQL、PostgreSQL、MongoDB,支持大規模時序資料存儲。
  • 知識庫與知識圖譜
    • 構建結構化知識圖譜:基因–疾病–藥物關係網。
    • 自主研發知識推理引擎,支持自然語言查詢。
  • C++ 工具重構與加速
    • 對關鍵算法(序列比對、聚類、網絡分析)進行底層優化。
    • 支持 GPU 加速(CUDA)、多線程與 SIMD 指令集。

3. 生物安全與生物情報支持

  • 合成生物安全檢測
    • 自動化 DNA 序列風險掃描:毒性基因、抗性基因、致病島檢測。
    • 自主研發生物威脅預測模型,結合文獻挖掘與實驗驗證數據。
  • 政策諮詢與技術評審
    • 為政府監管部門提供生物安全政策建議與技術可行性報告。
    • 協助合成生物企業進行風險評估與合規審查。
  • 應急監測與預警
    • 開發即時監測平台,接入公共資料庫與實驗數據,自動觸發安全預警。
    • 支持全球序列資料庫對接與跨區域疫情監測。

4. 學術與培訓支持

  • 課題設計與專案申請
    • 協助撰寫基金申請書,設計合理的實驗與數據分析方案。
    • 提供樣本量計算與統計設計建議。
  • 科研論文輔導
    • 結果可視化:高質量圖表製作(ggplot2、Plotly)。
  • 技術培訓與工作坊
    • Python/R 生物資訊學實戰課程。
    • 深度學習與組學分析專題講座。
    • 線上直播與線下培訓結合。