Business

1. End-to-End High-Throughput Omics Data Analysis

Raw Data Quality Control
- Automated QC pipeline: integrated FastQC and MultiQC; machine-learning–based outlier sample detection.
- Generates detailed reports with improvement suggestions.
Read Alignment & Quantification
- Supports RNA-seq (Hisat2, STAR), DNA-seq (BWA, Bowtie2), etc., with optimized parameters and parallel scheduling.
- C++-reengineered alignment core for large-scale sequencing data.
Differential Expression & Functional Annotation
- Differential gene selection: DESeq2, edgeR, combined with in-house batch effect correction module.
- Enrichment analysis: GO, KEGG, Reactome, cross-database comparison.
Single-Cell & Spatial Transcriptomics
- Single-cell preprocessing: Cell Ranger, Scanpy, Seurat.
- Cell subpopulation identification & trajectory inference: Monocle, PAGA.
- Spatial transcriptome integration and visualization.
Multi-Omics Data Integration
- Multi-view learning & network biology methods: MOFA, DIABLO.
- Construct gene–protein and metabolic pathway networks to uncover potential biomarkers.

Pipeline Automation
- Reproducible pipelines with Nextflow, Snakemake; supports containerization (Docker, Singularity).
- Cluster scheduling & cloud deployment (AWS, Alibaba Cloud, Huawei Cloud).
Web Interaction & Visualization
- Front end: Vue.js, React with interactive charts (ECharts, Plotly).
- Back end: Python (Django/Flask), Node.js + Express.
- Databases: MySQL, PostgreSQL, MongoDB for large-scale time-series storage.
Knowledge Base & Knowledge Graphs
- Build structured KG: gene–disease–drug relationship networks.
- In-house reasoning engine with natural language query support.
C++ Tool Refactoring & Acceleration
- Low-level optimization of key algorithms (alignment, clustering, network analysis).
- GPU acceleration (CUDA), multithreading, SIMD support.

Synthetic Biology Safety Screening
- Automated DNA risk scanning: toxin genes, resistance genes, pathogenicity islands.
- In-house threat prediction models combining literature mining and experimental data.
Policy Consultation & Technical Review
- Provide biosafety policy recommendations and feasibility reports for regulatory agencies.
- Assist synthetic biology companies with risk assessment and compliance audits.
Emergency Monitoring & Early Warning
- Real-time monitoring platform integrating public and experimental databases to trigger alerts.
- Global sequence database connectivity and cross-region outbreak surveillance.

Project Design & Grant Applications
- Assist with proposal writing and experimental/data analysis planning.
- Provide sample size calculations and statistical design advice.
Manuscript Guidance
- Results visualization: high-quality figure creation (ggplot2, Plotly).
Workshops & Training
- Hands-on courses in Python/R bioinformatics.
- Deep learning and omics analysis seminars.
- Combined live online and in-person training.