業務介紹
1. 高通量組學全流程數據分析
-
原始數據質控
- 自動化質控流程:整合 FastQC 同 MultiQC;基於機器學習嘅異常樣本檢測。
- 輸出詳細報告,提供改進建議。
-
序列比對同定量
- 支持 RNA-seq(Hisat2、STAR)、DNA-seq(BWA、Bowtie2)等主流工具,優化參數並行化調度。
- C++ 重構版序列比對內核,適用於大規模測序數據。
-
差異表達同功能註釋
- 差異基因篩選:DESeq2、edgeR,配合自家研發嘅批次效應校正模組。
- 富集分析:GO、KEGG、Reactome,多個數據庫交叉比對。
-
單細胞組學同空間轉錄組
- 單細胞數據預處理:Cell Ranger、Scanpy、Seurat。
- 細胞亞群識別同發育軌跡:Monocle、PAGA。
- 空間轉錄組整合分析,同空間可視化展示。
-
多組學數據整合
- 採用多視圖學習同網絡生物學方法:MOFA、DIABLO。
- 構建基因—蛋白同代謝通路網絡,發掘潛在生物標誌物。
2. 平台同軟件工程服務
-
分析流程自動化
- 基於 Nextflow、Snakemake 嘅可重現管道開發,支持容器化(Docker/Singularity)。
- 集群調度同雲平台部署(AWS、阿里雲、華為雲)。
-
Web 互動同可視化系統
- 前端:Vue.js、React,提供互動式圖表(ECharts、Plotly)。
- 後端:Python Django/Flask,Node.js + Express。
- 數據庫:MySQL、PostgreSQL、MongoDB,支持大規模時序數據儲存。
-
知識庫同知識圖譜
- 結構化知識圖譜構建:基因—疾病—藥物關係網。
- 自家研發知識推理引擎,支持自然語言查詢。
-
C++ 工具重構同加速
- 對關鍵算法(序列比對、聚類、網絡分析)進行底層優化。
- 支持 GPU 加速(CUDA)、多線程同 SIMD 指令集。
3. 生物安全同生物情報支持
-
合成生物安全檢測
- 自動化 DNA 序列風險掃描:毒性基因、抗性基因、致病島檢測。
- 自家研發生物威脅預測模型,結合文獻挖掘同實驗驗證數據。
-
政策諮詢同技術評審
- 為政府監管部門提供生物安全政策建議同技術可行性報告。
- 協助合成生物企業進行風險評估同合規審查。
-
應急監測同預警
- 開發實時監測平台,接入公眾數據庫同實驗數據,自動觸發安全預警。
- 支持全球序列數據庫對接同跨區域疫情監測。
4. 學術同培訓支持
-
課題設計同項目申報
- 幫助客戶撰寫基金申請書,設計合理實驗同數據分析方案。
- 提供樣本量計算同統計設計建議。
-
科研論文輔導
- 結果可視化:高水平圖表製作(ggplot2、Plotly)。
-
技術培訓同工作坊
- Python/R 生物信息學實戰課程。
- 深度學習同組學分析專題講座。
- 線上直播同線下培訓相結合。