業務介紹




1. 高通量組學全流程數據分析

  • 原始數據質控
    • 自動化質控流程:整合 FastQC 同 MultiQC;基於機器學習嘅異常樣本檢測。
    • 輸出詳細報告,提供改進建議。
  • 序列比對同定量
    • 支持 RNA-seq(Hisat2、STAR)、DNA-seq(BWA、Bowtie2)等主流工具,優化參數並行化調度。
    • C++ 重構版序列比對內核,適用於大規模測序數據。
  • 差異表達同功能註釋
    • 差異基因篩選:DESeq2、edgeR,配合自家研發嘅批次效應校正模組。
    • 富集分析:GO、KEGG、Reactome,多個數據庫交叉比對。
  • 單細胞組學同空間轉錄組
    • 單細胞數據預處理:Cell Ranger、Scanpy、Seurat。
    • 細胞亞群識別同發育軌跡:Monocle、PAGA。
    • 空間轉錄組整合分析,同空間可視化展示。
  • 多組學數據整合
    • 採用多視圖學習同網絡生物學方法:MOFA、DIABLO。
    • 構建基因—蛋白同代謝通路網絡,發掘潛在生物標誌物。

2. 平台同軟件工程服務

  • 分析流程自動化
    • 基於 Nextflow、Snakemake 嘅可重現管道開發,支持容器化(Docker/Singularity)。
    • 集群調度同雲平台部署(AWS、阿里雲、華為雲)。
  • Web 互動同可視化系統
    • 前端:Vue.js、React,提供互動式圖表(ECharts、Plotly)。
    • 後端:Python Django/Flask,Node.js + Express。
    • 數據庫:MySQL、PostgreSQL、MongoDB,支持大規模時序數據儲存。
  • 知識庫同知識圖譜
    • 結構化知識圖譜構建:基因—疾病—藥物關係網。
    • 自家研發知識推理引擎,支持自然語言查詢。
  • C++ 工具重構同加速
    • 對關鍵算法(序列比對、聚類、網絡分析)進行底層優化。
    • 支持 GPU 加速(CUDA)、多線程同 SIMD 指令集。

3. 生物安全同生物情報支持

  • 合成生物安全檢測
    • 自動化 DNA 序列風險掃描:毒性基因、抗性基因、致病島檢測。
    • 自家研發生物威脅預測模型,結合文獻挖掘同實驗驗證數據。
  • 政策諮詢同技術評審
    • 為政府監管部門提供生物安全政策建議同技術可行性報告。
    • 協助合成生物企業進行風險評估同合規審查。
  • 應急監測同預警
    • 開發實時監測平台,接入公眾數據庫同實驗數據,自動觸發安全預警。
    • 支持全球序列數據庫對接同跨區域疫情監測。

4. 學術同培訓支持

  • 課題設計同項目申報
    • 幫助客戶撰寫基金申請書,設計合理實驗同數據分析方案。
    • 提供樣本量計算同統計設計建議。
  • 科研論文輔導
    • 結果可視化:高水平圖表製作(ggplot2、Plotly)。
  • 技術培訓同工作坊
    • Python/R 生物信息學實戰課程。
    • 深度學習同組學分析專題講座。
    • 線上直播同線下培訓相結合。