AI时代的DevOps技术实战

AI时代的DevOps技术实战


云原生时代的DevOps技术实战

零、引言

在当今快速迭代的软件开发环境中,DevOps已经成为提升软件开发效率和质量的关键实践。根据DevOps Research and Assessment (DORA) 行业调研数据,采用成熟DevOps实践的精英级企业,软件部署频率可提升至每日甚至每小时多次,较传统模式高出数十倍;故障恢复时间(MTTR)从传统的数天缩短至分钟级,变更失败率也控制在5%以内。

当前的DevOps实践,早已脱离“自动化工具堆砌”的初级阶段,正朝着平台化、智能化、云原生、国际化的方向深度演进。对于科技行业而言,尤其是医疗健康、软件出海等细分领域,DevOps不仅是效率工具,更是保障业务合规性、实现全球本地化运营、支撑AI技术落地的核心基础设施。

当前,云原生架构的普及、AI Agent技术的渗透、软件出海的全球化需求,对DevOps提出了全新挑战:如何在多集群、多地域环境下实现一致的交付流程?如何通过智能化手段降低测试与运维的人工成本?如何让DevOps体系适配“全球标准化+本地定制化”的业务诉求?

本文将从实战角度出发,结合最新技术趋势与企业级落地经验,为技术管理者、研发与运维人员详细阐述CI/CD流水线、自动化测试、监控告警体系的建设方案,并结合平台化落地、出海场景适配等关键内容,帮助团队构建“工具标准化、流程自动化、决策数据化”的完善DevOps基础设施。

一、CI/CD流水线建设方案

CI/CD流水线是DevOps体系的核心载体,其设计合理性直接决定交付效率与质量。结合云原生技术趋势与软件出海、医疗合规等场景需求,以下从核心原则、工具选型、配置示例及优化策略四个维度,完善流水线建设方案。

1.1 流水线核心设计原则

构建高效的CI/CD流水线需遵循四大核心原则,兼顾效率、合规与地域适配需求:

A. 快速反馈原则:每次代码提交都应当触发流水线,并在最短时间内向开发人员反馈结果。根据行业最佳实践,轻量级的单元测试应当在代码提交后立即执行,而完整的集成测试则可以在后续阶段运行;对于软件出海项目,还需增加“本地化合规校验”的快速反馈步骤,避免因区域法规问题返工。

B. 流水线即代码原则:所有流水线的配置都应当存储在版本控制系统中,实现配置的可追溯性和可审计性;对于多地域团队协作,建议通过分支策略标准化(如`main`对应生产、`develop`对应集成、`feature/region-xx`对应本地特性),结合流水线配置的分支适配规则,兼顾全球协同与本地灵活度。

C. 阶段性门控原则:每个阶段都应当设置质量门禁,只有通过当前阶段的质量标准才能进入下一阶段;针对医疗健康等合规行业,需在生产部署前增加“合规审计审批”门控,留存完整的审批与交付记录,满足行业监管要求。

D. 云原生弹性原则:流水线应与Kubernetes等云原生架构深度绑定,采用动态节点调度替代固定执行节点,根据任务负载自动扩容或缩容,既保障大规模构建的效率,又降低闲置资源成本。

在实际设计中,流水线应当采用多阶段、可复用、地域适配的架构,完整流程至少包括:代码检出、依赖安装、代码编译、单元测试、代码分析、集成测试、安全扫描、本地化适配校验、合规审计、构建镜像、多地域镜像同步、部署到测试环境、端到端测试、部署到预发布环境、区域灰度验证、最终部署到生产环境(多地域集群)。每个阶段都应当是独立的、可重用的,并且具有明确的输入输出定义;同时支持阶段复用与条件执行,例如出海项目的“本地化校验”阶段,仅对`feature/region-xx`分支或特定地域的生产部署触发。

1.2 工具选型推荐

CI/CD引擎的选择需结合团队规模、技术栈及特殊场景需求,精准选型:

工具 核心优势 适配场景 落地注意事项
Jenkins 高度定制化、插件生态丰富 医疗健康合规项目(可通过插件实现审计日志固化)、复杂的跨地域流水线编排 需搭建高可用集群(主从架构+分布式构建),通过Jenkins Configuration as Code(JCasC)管理配置,降低维护成本;出海场景需配置多地域构建节点,减少镜像传输延迟
GitLab CI/CD 开箱即用、与代码仓库无缝集成 中小规模出海团队、企业内部多项目协同 开启分布式Runner,按地域部署Runner节点(如亚太、欧美),实现就近构建;通过GitLab Ultimate版的“合规流水线”功能,满足医疗行业审计需求
GitHub Actions 生态完善、按使用量计费 开源项目、软件出海项目(与GitHub生态深度绑定,便于全球协作) 利用自托管Runner部署在目标地域,避免跨境网络延迟;通过Secrets管理多地域的镜像仓库、云服务密钥
Tekton 云原生原生支持、标准化组件 大型云原生团队、软件出海多集群部署 结合Argo CD实现“CI构建+GitOps部署”全链路闭环;通过Tekton Chains实现制品溯源,满足出海合规的供应链安全要求

出海场景专属工具搭配

除核心CI/CD引擎外,出海项目可搭配以下专属工具,提升多地域交付效率与合规性:

A. 镜像同步:使用Dragonfly或Argo CD Image Updater,实现多地域镜像仓库(如阿里云CR、AWS ECR、欧洲Docker Hub)的高效同步,降低跨洋传输成本。

B. 合规校验:集成Checkov(基础设施合规)、License Finder(开源许可合规),避免出海项目违反目标区域的软件许可法规。

1.3 流水线配置示例(仅供参考)

基于上述原则与工具选型,以下以GitLab CI/CD为例,给出流水线配置,供大家参考:

# stage划分
stages:
  - build
  - test       # 并行执行单元/集成测试
  - analyze    # 并行执行代码分析/安全扫描
  - compliance # 合规审计(医疗/出海专属)
  - image
  - sync-image # 多地域镜像同步(出海专属)
  - deploy
  - verify
  - region-verify # 区域灰度验证(出海专属)

# 变量配置
variables:
  DOCKER_DRIVER: overlay2
  MAVEN_OPTS: "-Dmaven.repo.local=.m2/repository"
  # 多地域镜像仓库配置(出海示例)
  DOCKER_IMAGE_CN: registry-cn.example.com/myapp
  DOCKER_IMAGE_US: registry-us.example.com/myapp
  DOCKER_TAG: $CI_COMMIT_SHORT_SHA
  # 增量构建标记
  BASE_COMMIT: $CI_MERGE_REQUEST_TARGET_BRANCH_SHA || $CI_COMMIT_BEFORE_SHA

# 缓存机制升级
cache:
  key:
    files:
      - pom.xml # 仅当依赖文件变更时刷新缓存
    prefix: maven-cache
  paths:
    - .m2/repository
  policy: pull-push

# 并行执行
build:
  stage: build
  image: maven:3.9-openjdk-17
  script:
    # 增量构建:仅编译变更模块(适用于多模块Maven项目)
    - >
      if [ -n "$BASE_COMMIT" ]; then
        CHANGED_MODULES=$(git diff --name-only $BASE_COMMIT $CI_COMMIT_SHA | grep -E '^[a-zA-Z0-9_-]+/pom.xml' | cut -d '/' -f 1 | uniq | tr '\n' ',')
        if [ -n "$CHANGED_MODULES" ]; then
          mvn clean package -DskipTests=false -pl $CHANGED_MODULES -am
        else
          mvn clean package -DskipTests=false
        fi
      else
        mvn clean package -DskipTests=false
      fi
  artifacts:
    paths:
      - target/*.jar
    expire_in: 1 day
  retry:
    max: 2
    when: [runner_system_failure, stuck_or_timeout_failure] # 失败重试策略

# 单元测试
unit-test:
  stage: test
  image: maven:3.9-openjdk-17
  script:
    - mvn test
  coverage: '/Total.*? (100(?:\.0+)?\%|[1-9]?\d(?:\.\d+)?\%)$/'
  artifacts:
    reports:
      junit: target/surefire-reports/*.xml
    expire_in: 7 days
  retry: 1

# 集成测试
integration-test:
  stage: test
  image: maven:3.9-openjdk-17
  services:
    - postgres:15
    - redis:7
  variables:
    POSTGRES_DB: testdb
    POSTGRES_USER: testuser
    POSTGRES_PASSWORD: testpass
    REDIS_HOST: redis
    # Testcontainers优化:复用宿主机Docker,避免重复拉取镜像
    TESTCONTAINERS_RYUK_DISABLED: "true"
  script:
    - mvn verify -Dspring.profiles.active=it
  retry: 1

# 代码分析
sonarqube:
  stage: analyze
  image: sonarsource/sonar-scanner-cli:latest
  variables:
    SONAR_HOST_URL: "https://sonarqube.example.com"
    SONAR_TOKEN: $SONAR_TOKEN
  script:
    - sonar-scanner -Dsonar.projectKey=myapp -Dsonar.sources=src -Dsonar.coverage.jacoco.xmlReportPaths=target/site/jacoco/jacoco.xml
  # 医疗合规项目:关闭allow_failure,强制通过
  allow_failure: false

# 安全扫描
trivy:
  stage: analyze
  image:
    name: aquasec/trivy:latest
    entrypoint: [""]
  script:
    # 先扫描基础镜像,再扫描构建产物
    - trivy image --exit-code 1 --severity HIGH,CRITICAL $DOCKER_IMAGE_CN:base
    - trivy fs --exit-code 1 --severity HIGH,CRITICAL .
  allow_failure: false

# 合规审计
compliance-audit:
  stage: compliance
  image: python:3.11
  script:
    # 开源许可合规校验
    - pip install license-finder
    - license-finder check --fail-on-red
    # 医疗行业审计日志生成
    - echo "Pipeline Audit: $CI_PIPELINE_ID, Commit: $CI_COMMIT_SHA, User: $CI_COMMIT_AUTHOR" > audit.log
  artifacts:
    paths:
      - audit.log
    expire_in: 365 days # 合规留存1年
  only:
    - main
    - release/*

# 镜像构建
build-image:
  stage: image
  image: docker:latest
  services:
    - docker:dind
  script:
    - docker build -t $DOCKER_IMAGE_CN:$DOCKER_TAG -t $DOCKER_IMAGE_US:$DOCKER_TAG .
    # 镜像签名(供应链安全)
    - docker trust sign $DOCKER_IMAGE_CN:$DOCKER_TAG
    - docker trust sign $DOCKER_IMAGE_US:$DOCKER_TAG
    - docker push $DOCKER_IMAGE_CN:$DOCKER_TAG
    - docker push $DOCKER_IMAGE_US:$DOCKER_TAG
  only:
    - main
    - develop
  retry: 2

# 多地域镜像同步
sync-image:
  stage: sync-image
  image: dragonflyoss/dragonfly:latest
  script:
    # 亚太同步至欧洲(示例)
    - dfget pull $DOCKER_IMAGE_CN:$DOCKER_TAG --dest $DOCKER_IMAGE_EU:$DOCKER_TAG
    - docker push $DOCKER_IMAGE_EU:$DOCKER_TAG
  only:
    - main
  when: manual # 生产级同步需手动审批

# 部署预发布
deploy-staging:
  stage: deploy
  image: bitnami/kubectl:latest
  script:
    - kubectl set image deployment/myapp myapp=$DOCKER_IMAGE_CN:$DOCKER_TAG -n staging
    - kubectl rollout status deployment/myapp -n staging --timeout=5m
  environment:
    name: staging
    url: https://staging.example.com
  only:
    - develop

# 生产部署
deploy-production-cn:
  stage: deploy
  image: bitnami/kubectl:latest
  script:
    - kubectl set image deployment/myapp myapp=$DOCKER_IMAGE_CN:$DOCKER_TAG -n production
    - kubectl rollout status deployment/myapp -n production --timeout=5m
  environment:
    name: production-cn
    url: https://cn.example.com
  when: manual
  only:
    - main

deploy-production-us:
  stage: deploy
  image: bitnami/kubectl:latest
  script:
    - kubectl set image deployment/myapp myapp=$DOCKER_IMAGE_US:$DOCKER_TAG -n production
    - kubectl rollout status deployment/myapp -n production --timeout=5m
  environment:
    name: production-us
    url: https://us.example.com
  when: manual
  only:
    - main

# 基础验证
smoke-test:
  stage: verify
  script:
    - curl -f https://staging.example.com/health || exit 1
  allow_failure: false

# 区域灰度验证
region-verify:
  stage: region-verify
  script:
    # 美国区域灰度用户验证
    - curl -f https://us.example.com/api/v1/region/verify?user_type=gray || exit 1
    # 亚太区域核心功能验证
    - curl -f https://cn.example.com/api/v1/payment/health || exit 1
  only:
    - main
  when: manual

1.4 流水线优化策略

流水线建设并非一蹴而就,需结合业务场景持续优化。在原有并行执行、增量构建、缓存机制的基础上,可以考虑采用部分优化策略,进一步提升流水线效率、稳定性与合规性:

(一)智能化优化

借助AI技术降低人工成本,提升故障处理效率:

A. AI辅助故障定位:集成StepCI AI或Jenkins AI Assistant,当流水线失败时,自动分析日志、代码变更记录,生成故障根因建议(如“单元测试失败源于新增接口未处理空值,对应代码文件:src/main/java/com/example/Service.java:45”)。

B. 动态阶段调度:基于AI算法预测任务执行时长,自动分配最优资源(如“集成测试需启动多个容器,分配高算力节点;代码分析为轻量任务,分配常规节点”)。

C. 测试用例智能筛选:通过Diffblue Cover等工具,基于代码变更自动筛选受影响的测试用例,避免全量执行,进一步缩短反馈周期。

(二)出海专项优化

针对多地域部署场景,优化流水线的地域适配能力:

A. 地域就近构建:按目标市场部署构建节点(如面向北美市场的代码,在美东节点构建),减少跨境网络延迟,提升镜像构建与推送效率。

B. 多地域环境隔离:通过Kubernetes命名空间+地域标签,实现不同区域的部署环境完全隔离,避免本地配置变更影响其他区域业务。

C. 合规日志全链路留存:将流水线的每一步执行日志、审批记录、制品签名,同步至中心化审计平台(如ELK Stack),并按目标区域法规要求设置留存时长(如欧盟GDPR要求留存1年以上)。

(三)可观测性优化

为流水线本身建立监控体系,实现问题可发现、可分析、可优化:

通过Prometheus + Grafana采集以下指标:

A. 执行效率:各阶段平均执行时长、总时长、并行度利用率;

B. 稳定性:各阶段成功率、失败原因分布、重试次数;

C. 资源消耗:构建节点CPU/内存使用率、镜像传输速度。

通过指标分析持续优化,例如“发现欧美区域镜像同步耗时过长,新增欧洲镜像仓库节点”“单元测试成功率持续低于95%,推动开发团队完善测试用例”。

二、自动化测试体系建设

自动化测试是保障DevOps交付质量的关键环节,需与CI/CD流水线深度融合,同时适配AI技术趋势、软件出海及医疗合规需求。以下从测试分层、工具选型、实施路径及质量门禁四个维度,完善自动化测试体系建设方案。

2.1 测试金字塔与分层策略

在原有测试金字塔模型基础上,结合AI技术融合与软件出海、医疗合规的特殊需求,优化分层策略与核心要求,实现“质量与效率并重”:

(一)金字塔模型升级

在传统三层结构基础上,增加AI辅助测试层,贯穿单元、集成、E2E全流程,核心作用是“降低用例编写成本、提升测试效率、优化故障定位”,形成“AI赋能+分层执行”的新型测试体系。

(二)各层测试要求

测试层级 核心目标 出海场景特殊要求 医疗合规特殊要求
单元测试 验证代码逻辑正确性 覆盖多语言、多时区、多币种的业务逻辑(如金额换算、日期格式化) 覆盖合规相关的核心逻辑(如客户数据脱敏、权限校验),测试记录留存可追溯
集成测试 验证组件间协作 验证跨地域服务调用的稳定性(如亚太服务调用欧美数据库)、区域化接口适配性 验证医疗数据传输的加密性、合规审计日志的生成准确性
E2E测试 验证用户流程 模拟不同区域用户的网络环境(如低延迟/高延迟)、浏览器/设备习惯,覆盖本地化UI(如语言、支付方式) 模拟合规审核流程,验证权限管控、数据访问审计的有效性

(三)覆盖率精细化要求

摒弃“一刀切”的覆盖率指标,采用分层精细化管控,兼顾测试成本与质量:

A. 单元测试:通用业务≥70%,核心业务(如支付、客户数据)≥95%;

B. 集成测试:核心接口100%覆盖,区域化适配接口100%覆盖;

C. E2E测试:P0级核心流程100%覆盖,区域化专属流程100%覆盖。

2.2 测试工具链推荐

工具链的选择需适配分层测试需求,同时结合AI趋势与特殊场景,结合AI测试工具及出海、医疗合规专属工具,形成全栈工具链:

(一)AI测试工具

测试类型 AI工具推荐 核心价值
单元测试 Diffblue Cover、Tabnine Test 基于代码自动生成单元测试用例,覆盖边缘场景,降低编写成本
集成测试 Postman AI、REST Assured AI 自动生成接口测试用例、参数化场景,智能分析接口响应异常
E2E测试 Playwright AI、Cypress AI 自动识别UI元素、生成测试脚本,实现脚本自愈,降低维护成本
性能测试 k6 AI、JMeter AI 基于业务场景自动生成压测脚本,智能预测性能瓶颈

(二)出海/合规专属测试工具

针对出海、医疗合规场景的特殊需求,搭配以下专属工具,保障测试合规性与本地化适配性:

A. 本地化测试:使用BrowserStack(多地域、多设备测试)、Lokalise(多语言文案校验),验证不同区域的UI适配性、语言准确性。

B. 合规测试:医疗行业使用OWASP Dependency-Check(依赖合规)、HIPAA Compliance Scanner(医疗数据合规);出海项目使用GDPR Tester(欧盟合规)、CCPA Checker(加州合规)。

C. 多地域性能测试:使用k6 Cloud(多地域压测节点),模拟不同区域用户的并发访问,验证服务在跨地域场景下的性能表现。

2.3 测试自动化实施路径

测试自动化的落地需结合团队协作与合规要求,在原有四阶段实施路径基础上,结合团队协作机制与合规场景落地细节,确保测试自动化在企业级场景中可持续推进:

(一)跨团队协作机制

打破研发与测试的壁垒,实现“测试左移”与全球协同:

A. 测试左移深化:开发人员与测试人员组成“特性小组”,在需求评审阶段共同定义测试用例,开发过程中同步编写单元/集成测试,实现“需求-开发-测试”一体化。

B. 全球协作测试:出海团队按地域划分测试小组(如亚太组、欧美组),负责本地专属场景的测试用例编写与执行,通过测试管理平台(如TestRail、Zephyr)实现全球测试用例的统一管理。

(二)合规场景落地细节(医疗/出海)

针对合规敏感场景,规范测试流程,确保测试过程与结果符合法规要求:

A. 测试数据合规:医疗行业使用合成数据(如Mockaroo生成的患者数据)替代真实数据;出海项目对测试数据进行多维度脱敏(如姓名、地址、银行卡号),满足目标区域隐私法规。

B. 测试记录留存:所有测试用例、执行结果、缺陷记录,同步至合规档案系统,医疗行业留存≥5年,出海项目按目标区域法规要求留存(如欧盟GDPR≥3年)。

2.4 测试质量门禁配置

质量门禁是测试自动化与CI/CD流水线衔接的关键,在原有质量门禁基础上,升级为精细化、动态化的门禁体系,适配不同业务场景的差异化需求:

(一)分层质量门禁

将门禁分为“基础门禁”“核心门禁”“合规门禁”,不同分支、不同场景触发不同门禁,兼顾效率与质量:

A. 基础门禁:单元测试通过率100%、新代码覆盖率≥75%,适用于`feature`分支;

B. 核心门禁:集成测试通过率100%、E2E核心流程通过率100%、安全漏洞为0,适用于`develop`分支;

C. 合规门禁:合规测试通过率100%、审计日志完整、依赖许可合规,适用于`main`分支与生产部署。

(二)动态阈值门禁

基于历史数据与业务场景,通过AI算法动态调整阈值,避免“一刀切”导致的效率损耗或质量风险:

A. 性能测试:高峰期(如电商大促、医疗挂号高峰)的延迟阈值放宽20%,非高峰期严格管控;

B. 错误率:出海项目的欧美区域(网络稳定)错误率阈值≤0.5%,东南亚区域(网络波动)放宽至≤1%。

(三)门禁失败处理机制

建立“分级处理、快速响应”的机制,确保门禁失败后快速定位、及时解决:

A. 严重失败(如核心测试不通过、合规测试失败):立即阻断流水线,通知开发与测试负责人,1小时内响应;

B. 轻微失败(如非核心代码覆盖率不达标):允许临时放行,但需在24小时内补齐测试用例,通过二次校验。

三、监控告警体系建设

监控告警体系是DevOps稳定运行的“哨兵”,需实现“技术+业务+地域”的全维度可观测,同时适配多地域部署与合规需求。以下从可观测性基础、工具选型、指标设计、告警配置及事件响应五个维度,完善监控告警体系建设方案。

3.1 可观测性三大支柱

在原有日志、指标、链路三大支柱基础上,结合软件出海多地域场景的适配方案,形成全维度可观测性体系:

(一)业务可观测性

业务可观测性是连接技术监控与业务运营的核心,通过埋点采集与指标建模,实现对业务状态的实时监控,让监控更贴合业务价值:

核心指标分为:

A. 用户维度:各区域日活/月活、注册转化率、留存率;

B. 交易维度:各区域订单量、GMV、支付成功率、退款率;

C. 合规维度:医疗数据访问次数、脱敏成功率、区域法规合规率。

工具推荐:使用Apache SkyWalking(业务埋点)、Flink(实时计算)、Grafana(业务看板),实现业务指标的实时采集与可视化。

(二)多地域可观测性适配方案

针对多地域部署场景,优化可观测性架构,避免跨地域数据传输延迟与丢失:

A. 数据采集本地化:在各区域集群部署本地采集节点(如Prometheus Agent、Fluent Bit),避免跨地域采集导致的延迟与数据丢失。

B. 数据存储分层:

A. 本地热数据(0-7天):存储在区域内的时序数据库/日志仓库,用于快速查询;

B. 全球冷数据(7天以上):同步至中心化数据湖(如S3、OSS),用于跨地域分析与合规审计。

C. 追踪链路跨地域关联:使用OpenTelemetry的全局TraceID,实现跨地域服务调用的链路追踪(如亚太用户请求→欧美服务→东南亚数据库)。

3.2 监控告警工具栈推荐

在原有工具栈基础上,结合多地域高可用部署方案与AI告警工具,适配企业级大规模、跨地域场景,提升监控告警的效率与准确性:

(一)多地域工具部署架构

采用分布式部署架构,兼顾本地查询效率与全球统一管理:

A. Prometheus联邦集群:采用“区域Prometheus + 全球联邦网关”架构,区域Prometheus采集本地指标,联邦网关聚合全球数据,兼顾本地查询效率与全球监控需求。

B. 日志架构优化:各区域部署Loki集群存储本地日志,通过Grafana Mimir实现全球日志聚合,支持跨地域日志查询。

C. 链路追踪架构:各区域部署Jaeger Collector,全球部署Jaeger Query,实现跨地域链路的统一查询与分析。

(二)AI告警工具

工具类型 推荐工具 核心价值
异常检测 Grafana AI Anomaly Detection、Prometheus Alertmanager AI 基于机器学习识别异常指标,替代传统固定阈值,减少误报/漏报
根因分析 BigPanda、Moogsoft 自动关联指标、日志、链路数据,定位故障根因,生成解决方案建议
告警降噪 Opsgenie AI、PagerDuty AI 自动合并重复告警、抑制次级告警,按业务影响度排序告警

3.3 监控指标体系设计

在原有基础设施、应用层指标基础上,结合出海地域专属指标与医疗合规专属指标,形成覆盖技术、业务、合规、地域的全场景指标体系:

(一)出海地域专属指标

指标类别 核心指标 监控意义
网络指标 跨地域延迟、丢包率、DNS解析时长 评估跨地域服务调用的网络质量
本地化指标 多语言文案加载成功率、区域支付接口成功率 验证本地化适配的有效性
地域运营指标 各区域服务可用性、核心功能成功率 保障不同区域用户的服务体验

(二)医疗合规专属指标

指标类别 核心指标 监控意义
数据安全指标 患者数据脱敏成功率、未授权访问次数、数据加密率 保障医疗数据的安全合规
审计日志指标 审计日志生成率、日志留存时长、日志完整性 确保合规审计可追溯
权限管控指标 角色权限变更次数、越权访问尝试次数 验证权限管控的有效性

3.4 告警规则配置最佳实践
在原有告警分级、阈值设置的基础上,结合多地域告警策略与合规专属告警规则,并优化告警通知的精准性:

(一)多地域告警策略
地域化告警路由:按区域划分告警接收人(如亚太区域告警通知上海团队,欧美区域告警通知纽约团队),避免跨时区干扰。
时区适配告警:核心告警在目标区域的工作时间触发升级流程,非工作时间仅通知值班人员,减少告警疲劳。
地域化阈值调整:针对网络波动较大的区域(如东南亚),适当放宽延迟、错误率等指标的告警阈值。

(二)告警通知优化
告警内容丰富化:增加业务影响范围(如 “影响美国区域 10% 的付费用户”)、临时解决方案(如 “可临时切换至备用支付接口”),提升响应效率。
多渠道联动通知:P1 级告警采用 “电话 + 短信 + 即时通讯” 三重通知,P2 级告警采用 “即时通讯 + 邮件”,P3/P4 级告警采用邮件通知。

3.5 事件响应与自动化处理
在原有事件响应、自动化处理的基础上,增加云原生自愈场景与合规故障专属复盘机制:

(一)云原生自愈场景扩展
结合 Kubernetes 与 GitOps,实现更精细化的自愈能力:
跨地域服务容灾:当某区域集群故障时,通过Argo CD自动将流量切换至备用区域集群(如美国集群故障,切换至欧洲集群)。
AI Agent 辅助自愈:部署AI 运维 Agent,当检测到异常时,自动执行预设脚本(如 “重启服务”“扩容节点”),并在执行后生成自愈报告。
依赖服务故障降级:当跨地域依赖服务故障时,自动触发服务降级(如隐藏非核心功能、返回缓存数据),保障核心业务可用。

(二)合规故障专属复盘机制
对于医疗合规、出海合规相关的故障,建立专项复盘机制:
复盘组成员:研发、运维、合规、法务人员共同参与,确保复盘覆盖技术、合规、法律全维度。
复盘核心内容:故障是否违反法规、合规监控是否存在漏洞、响应流程是否符合合规要求、如何优化避免再次发生。
复盘落地:将复盘结论转化为监控规则更新、流程优化、培训内容,并留存复盘文档,作为合规审计的重要依据。

四、DevOps 平台化建设建议

4.1 统一 DevOps 平台架构
在原有平台架构基础上,结合云原生与出海、医疗合规的需求,优化平台架构设计,明确核心能力扩展方向:

(一)云原生架构升级
采用“核心平台 + 地域节点”的分布式架构,适配多地域部署需求:
核心平台:部署在企业总部地域,负责统一管理、配置分发、数据聚合、合规审计;
地域节点:部署在各目标市场,负责本地流水线执行、监控采集、应用部署,实现就近服务。
平台核心模块采用微服务架构,通过Istio Service Mesh实现服务间的流量治理与跨地域通信,通过Vault实现多地域敏感信息的统一管理。

(二)核心能力扩展(出海)
全球化配置管理:支持 “全球默认配置 + 地域定制配置”,实现配置的统一管理与本地灵活适配。
合规管理模块:内置合规审计、法规库、许可管理功能,自动扫描流水线、测试、部署过程中的合规风险。
多地域资源管理:统一管理各区域的 Kubernetes 集群、镜像仓库、监控资源,支持一键创建多地域环境。

4.2 GitOps 实践
在原有 GitOps 理念与工具推荐基础上,增加多地域同步实践与合规 GitOps方案,适配企业级大规模、合规敏感场景:

(一)多地域 GitOps 同步方案
采用“主 Git 仓库 + 地域子仓库”的架构,结合 Argo CD 实现多地域配置同步:
主 Git 仓库:存储全球统一的应用配置(如核心业务逻辑、基础架构配置);
地域子仓库:存储本地定制化配置(如地域化参数、支付接口配置),通过Git Submodule或Argo CD ApplicationSet与主仓库关联;
同步策略:主仓库变更自动同步至所有子仓库,子仓库变更仅作用于本地集群,兼顾全球标准化与本地灵活性。

(二)合规 GitOps(医疗 / 出海专属)
配置变更审计:所有 GitOps 配置变更必须通过代码评审,并留存评审记录、提交记录,实现 “配置变更可追溯”。
配置合规校验:在 Argo CD 同步前,集成OPA Gatekeeper,对配置进行合规校验(如 “医疗服务必须配置数据加密”“出海服务必须设置地域标签”),校验不通过则禁止同步。
镜像签名校验:通过Cosign验证镜像签名,确保部署的制品来自可信流水线,防止供应链攻击。

4.3 平台工程实践

在原有平台工程理念基础上,通过IDP深化实践与AI赋能能力,让平台真正成为 “研发人员的生产力工具”:

(一)IDP 核心能力深化
基于 Backstage,扩展以下核心能力:
应用全生命周期管理:从应用创建(脚手架)、开发、测试、部署到下线,提供全流程一站式服务。
服务目录增强:除传统中间件外,建议增加地域化服务(如本地支付接口、合规审计服务)、AI 服务(如 AI 测试、AI 告警),支持研发人员一键申请使用。
多地域环境自助创建:研发人员通过界面选择目标区域,即可一键创建符合当地法规的开发 / 测试环境,无需关注底层基础设施。

(二)AI 赋能平台工程
AI 助手集成:在 IDP 中嵌入AI 助手,研发人员可通过自然语言提问(如 “如何创建美国区域的 K8s 环境?”“为什么我的流水线在欧洲节点失败?”),获得实时解答与操作指引。
自动化方案生成:基于研发人员的需求(如 “开发一个医疗挂号微服务”),AI 自动生成应用脚手架、流水线配置、测试用例、监控规则,大幅提升研发效率。
平台智能优化:通过 AI 分析平台的使用数据(如流水线执行时长、环境创建频率),自动识别瓶颈并给出优化建议(如 “建议在欧洲新增构建节点”“优化 Maven 缓存策略”)。

五、总结

构建完善的 DevOps 实践体系是一个持续演进、持续适配的过程。当前的DevOps,早已超越 “工具自动化” 的范畴,成为融合云原生架构、AI 技术、合规管理、全球化运营的综合能力体系。

在实施过程中,建议团队遵循“因地制宜、循序渐进、数据驱动”的原则:
因地制宜:根据自身业务特点(如是否出海、是否合规)、团队规模、技术栈,选择合适的工具与方案,避免 “盲目跟风”;
循序渐进:从基础流水线、单元测试、核心监控入手,逐步扩展至全链路自动化、智能化、平台化;
数据驱动:通过 DORA 指标、流水线指标、监控指标,量化 DevOps 转型效果,持续优化流程与工具。

成功的 DevOps 实践,工具是基础,流程是核心,文化是灵魂。需要建立 “共享责任感” 的文化,让开发、测试、运维、合规、业务团队共同对软件的交付质量、运行稳定性、合规性负责;通过自动化手段减少人工操作,通过实时反馈加速问题解决,通过 AI 技术提升效率,通过合规管控降低风险,最终实现组织软件交付能力的质的飞跃,为业务创新与全球化扩张提供坚实支撑。

快速提升单元覆盖率

最近到新公司,接手了几十个老项目。由于项目特殊需要,需要快速将一个模块的单元测试覆盖率提升到80%以上。

怀着忐忑的心情看了一下,该模块居然还有一个单元测试,整体覆盖率为0,欲哭无泪啊。

手工写是来不及了,那就想办法自动生成吧。找了一下,最终决定采用EvoSuite。

EvoSuite有多种方式可以配置,包括命令行模式、Maven插件模式以、Eclipse插件模式、IDEA插件模式等。

一、maven模式
1、修改POM文件,在对应位置添加相关内容

<properties>
	<evosuiteVersion>1.0.6</evosuiteVersion>
</properties>

<dependencies>
	<dependency>
		<groupId>junit</groupId>
		<artifactId>junit</artifactId>
		<version>4.12</version>
		<scope>test</scope>
	</dependency>
	<dependency>
		<groupId>org.evosuite</groupId>
		<artifactId>evosuite-standalone-runtime</artifactId>
		<version>${evosuiteVersion}</version>
		<scope>test</scope>
	</dependency>
</dependencies>

<build>
	<pluginManagement>
		<plugins>
			<plugin>
				<groupId>org.eclipse.m2e</groupId>
				<artifactId>lifecycle-mapping</artifactId>
				<version>1.0.0</version>
				<configuration>
					<lifecycleMappingMetadata>
						<pluginExecutions>
							<pluginExecution>
								<pluginExecutionFilter>
									<groupId>org.apache.maven.plugins</groupId>
									<artifactId>maven-compiler-plugin</artifactId>
									<versionRange>[2.5,)</versionRange>
									<goals>
										<goal>prepare</goal>
									</goals>
								</pluginExecutionFilter>
								<action>
									<ignore />
								</action>
							</pluginExecution>
						</pluginExecutions>
					</lifecycleMappingMetadata>
				</configuration>
			</plugin>
		</plugins>
	</pluginManagement>
	<plugins>
		<plugin>
			<groupId>org.evosuite.plugins</groupId>
			<artifactId>evosuite-maven-plugin</artifactId>
			<version>${evosuiteVersion}</version>
			<executions>
				<execution>
					<goals>
						<goal>prepare</goal>
					</goals>
					<phase>process-test-classes</phase>
				</execution>
			</executions>
		</plugin>

		<plugin>
			<groupId>org.apache.maven.plugins</groupId>
			<artifactId>maven-surefire-plugin</artifactId>
			<version>2.17</version>
			<configuration>
				<properties>
					<property>
						<name>listener</name>
						<value>org.evosuite.runtime.InitializingListener</value>
					</property>
				</properties>
			</configuration>
		</plugin>

		<!--plugin>
			<groupId>org.codehaus.mojo</groupId>
			<artifactId>build-helper-maven-plugin</artifactId>
			<version>1.8</version>
			<executions>
				<execution>
					<id>add-test-source</id>
					<phase>generate-test-sources</phase>
					<goals>
						<goal>add-test-source</goal>
					</goals>
					<configuration>
						<sources>
							<source>.evosuite/evosuite-tests</source>
						</sources>
					</configuration>
				</execution>
			</executions>
		</plugin-->

		<plugin>
			<artifactId>maven-compiler-plugin</artifactId>
			<version>3.8.1</version>
			<configuration>
				<source>1.8</source>
				<target>1.8</target>
			</configuration>
		</plugin>
	</plugins>
</build>

2、生成单元测试

mvn -DmemoryInMB=4000 -Dcores=4 evosuite:generate test

#生成的单元测试在
#.evosuite/best-tests
#拷贝到正确的路径就可以了

二、命令行模式
1、下载evosuite-1.0.6.jar包

Downloads

2、收集项目依赖,把evosuite-1.0.6.jar也放入target/dependency文件夹

mvn dependency:copy-dependencies

3、生成单元测试

cd target/dependency
java -jar evosuite-1.0.6.jar -help
java -Duse_separate_classloader=false -jar evosuite-1.0.6.jar -projectCP YOUR_CLASS_PATH -generateSuite -target ..\classes

#生成的单元测试在
#target/dependency/evosuite-tests
#拷贝到正确的路径就可以了

三、Eclipse插件模式
在eclipse中安装evosuite插件,需要额外的插件地址:
http://www.evosuite.org/update

四、单元覆盖率
1、插件安装
在eclipse中搜索并安装EclEmma Java Code Coverage插件,直接搜索即可

2、修改class loader配置

#默认使用单独的class loader,覆盖率会为0
separateClassLoader = true
#全局替换为
separateClassLoader = false

3、然后在项目上,右键,Coverage as-》JUnit Test
就可以看到覆盖率了哦。
我试过两个项目,一个简单的项目,覆盖率为95以上。
一个复杂一些的Web项目,覆盖率仅为30%左右。

五、总结
生成的单元测试,实际上没有什么维护性,如何用于生产环境,待探索。

备份还原Gitlab

1、查看gitlab版本

gitlab-rake gitlab:env:info
System information
...
GitLab information
Version:        12.2.8
...
GitLab Shell
Version:        9.3.0
...

2、备份gitlab

gitlab-rake gitlab:backup:create
#会在这个路径生成新的备份文件
/var/opt/gitlab/backups/XXX_gitlab_backup.tar

3、准备新服务器
在新服务器上安装相同版本的gitlab,并将备份文件拷贝到新服务器相同路径

4、还原

gitlab-ctl stop unicorn
gitlab-ctl stop sidekiq
gitlab-rake gitlab:backup:restore BACKUP=XXX
gitlab-ctl start  

5、验证

gitlab-rake gitlab:check SANITIZE=true

Git06传输大repository失败

1、最近接手了一个项目,下载代码时,总会报错

git clone https://e.coding.net/xxx/xxx.git
error: RPC failed; curl 18 transfer closed with outstanding read data remaining

2、有建议说将缓存设置大一些,但没有用

#524288000单位为Byte,524288000B也就是 500MB
git config --global http.postBuffer 524288000

#1G
git config --global http.postBuffer 1048576000

3、最后将下载方式从https改为ssh方式就好了

ssh-keygen -t rsa -C "neohope@yahoo.com"
GIT_SSH_COMMAND="ssh -i /PATH_TO_ISA/xxx.rsa" git clone git@e.coding.net:xxx/xxx.git

SonarQube集成代码覆盖率

Java项目

#清理,并构建
mvn clean install javadoc:aggregate -Dadditionalparam=-Xdoclint:none surefire-report:report -Daggregate=true

#sonar收集信息
mvn sonar:sonar -Dsonar.host.url=http://127.0.0.1:9000 -Dsonar.scm.disabled=True -Dsonar.junit.reportPaths=target/surefire

.Net项目

#准备收集信息
MSBuild.SonarQube.Runner.exe begin /k:"MyProject" /n:"MyProject" /v:"1.0" /d:sonar.host.url=http://127.0.0.1:9000 /d:sonar.scm.disabled=True /d:sonar.cs.vstest.reportsPaths="%CD%\*.trx" /d:sonar.cs.vscoveragexml.reportsPaths="%CD%\MyProject.coverage.xml"

#清理并构建项目
msbuild MyProject /t:Clean /t:Rebuild

#进行单元测试并生成测试报告
"%VSINSTALLDIR%\Team Tools\Dynamic Code Coverage Tools\CodeCoverage.exe" collect /output:"%CD%\MyProject.coverage" /verbose "%VSINSTALLDIR%\Common7\IDE\CommonExtensions\Microsoft\TestWindow\vstest.console.exe" /Logger:trx "MyProject\bin\Debug\MyProject.dll"

#报告转换为xml格式
"%VSINSTALLDIR%\Team Tools\Dynamic Code Coverage Tools\CodeCoverage.exe" analyze /output:"%CD%\MyProject.coverage.xml" "%CD%\MyProject.coverage"

#结束分析
MSBuild.SonarQube.Runner.exe end

SonarQube集成单元测试结果

对于Java来说,最简单的就是用maven进行构建

#surefire-report:report -Daggregate=true要求多个模块的报告合成一个
#可以用site作为替代,比这个更简单
mvn clean install javadoc:aggregate -Dadditionalparam=-Xdoclint:none surefire-report:report -Daggregate=true

#-Dsonar.host.url指定SonarQube地址
#-Dsonar.scm.disabled要求SonarQube不要自己去更新SVN或GIT
#-Dsonar.junit.reportPaths是单元测试报告的路径
mvn sonar:sonar -Dsonar.host.url=http://IP:9000 -Dsonar.scm.disabled=True -Dsonar.junit.reportPaths=Path_To_Surefire_Report

对于CSharp项目来说,用VS自带的CodeCoverage最方便了

#准备
#我一般只指定项目key就好了,多数情况下就是Solution名称
#d:sonar.cs.vscoveragexml.reportsPath一定要指定到正确位置
MSBuild.SonarQube.Runner.exe begin /k:"项目Key" /n:"项目名称" /v:"项目版本" /d:sonar.cs.vscoveragexml.reportsPaths="%CD%\MyProject.coverage.xml"

#构建Solution
msbuild 项目名称

#生成coverage报告
"%VSINSTALLDIR%\Team Tools\Dynamic Code Coverage Tools\CodeCoverage.exe" collect /output:"%CD%\MyProject.coverage" "PATH_TO_TEST_DLL1" "PATH_TO_TEST_DLL2" "PATH_TO_TEST_DLL3"

#coverage报告转为XML版本
"%VSINSTALLDIR%\Team Tools\Dynamic Code Coverage Tools\CodeCoverage.exe" analyze /output:"%CD%\MyProject.coverage.xml" "%CD%\MyProject.coverage"

#完成
MSBuild.SonarQube.Runner.exe end

Selenium入门04

接上一节,说一下Grid的用法

1、启动hub

set JAVA_HOME=C:\NeoLanguages\Java\JDK\jdk_x86_1.8.0_77
set PATH=%JAVA_HOME%\bin;%PATH%;C:\NeoTest\TestSelenium\trunk\bin\x86\;
set webdriver.gecko.driver=C:\NeoTest\TestSelenium\trunk\bin\x86\geckodriver.exe

java -jar ../lib/selenium-server-standalone-3.3.1.jar -role hub -hubConfig hubConfig.json -debug true

pause

hubConfig.json

{
  "port": 4444,
  "newSessionWaitTimeout": -1,
  "servlets" : [],
  "withoutServlets": [],
  "custom": {},
  "capabilityMatcher": "org.openqa.grid.internal.utils.DefaultCapabilityMatcher",
  "throwOnCapabilityNotPresent": true,
  "cleanUpCycle": 5000,
  "role": "hub",
  "debug": false,
  "browserTimeout": 0,
  "timeout": 1800
}

2、启动node

set JAVA_HOME=C:\NeoLanguages\Java\JDK\jdk_x86_1.8.0_77
set PATH=%JAVA_HOME%\bin;%PATH%;C:\NeoTest\TestSelenium\trunk\bin\x86\;
set webdriver.gecko.driver=C:\NeoTest\TestSelenium\trunk\bin\x86\geckodriver.exe

java -jar ../lib/selenium-server-standalone-3.3.1.jar -role node -nodeConfig node01Config.json -debug true

pause

node01Config.json

{
 "capabilities":
  [
    {
      "browserName": "firefox",
      "maxInstances": 5,
      "seleniumProtocol": "WebDriver"
    }
  ],
  "proxy": "org.openqa.grid.selenium.proxy.DefaultRemoteProxy",
  "maxSession": 5,
  "port": 5555,
  "register": true,
  "registerCycle": 5000,
  "hub": "http://192.168.130.178:4444",
  "nodeStatusCheckTimeout": 5000,
  "nodePolling": 5000,
  "role": "node",
  "unregisterIfStillDownAfter": 60000,
  "downPollingLimit": 2,
  "debug": false,
  "servlets" : [],
  "withoutServlets": [],
  "custom": {}
}

3、可以在hub中看到注册情况
http://localhost:4444/grid/console
这个地方一定要注意,每个node上的浏览器及操作系统信息,向hub发送指令时,必须符合该信息

4、运行脚本
TestHelloWorldHub.py

# !C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2016-10-22
@author: Hansen
HelloWorld sample for NeoSelenium
'''

from NeoSelenium import initEngine
from NeoSelenium import deInitEngine
from NeoSelenium import initEngineHub

#一个简单的查询测试
def neohope_search_test():
    try:
        #myEngine = initEngine('ie32')
        #myEngine = initEngine('ie64')
        #myEngine = initEngine('chrome')
        #myEngine = initEngine('ff32')
        #myEngine = initEngine('ff64')
        #myEngine = initEngineRemote()
	myEngine = initEngineHub()

        base_url = "https://www.neohope.com"
        myEngine.get(base_url + "/")
        myEngine.find_element_by_name("s").clear()
        myEngine.find_element_by_name("s").send_keys("Metabase")
        myEngine.find_element_by_css_selector("button.search-submit").click()
        myEngine.implicitly_wait(1000)
        #print(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
        queryResultLenght = len(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
        #print(queryResultLenght)
        #应该是1但现在是10
        assert queryResultLenght==1
    finally:
        #deInitEngine(myEngine)
        print("test end")

#start here
neohope_search_test()

NeoSelenium.py

#!C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2017-04-07
@author: Hansen
NeoSelenium
'''

import os
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

NPath = None
x86Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x86;"
x64Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x64;"

'''
selenium remote engine init
'''
def initEngineRemote():
    engine = webdriver.Remote(command_executor="http://192.168.130.178:4444/wd/hub", desired_capabilities=DesiredCapabilities.FIREFOX)
    return engine

'''
selenium remote engine init
'''
def initEngineHub():
    engine = webdriver.Remote(command_executor="http://192.168.130.178:5555/wd/hub", desired_capabilities={
        "browserName": "firefox",
        "platform": "VISTA"
    })
    return engine   

'''
selenium engine deInit
'''
def deInitEngine(engine):
    engine.close()
    engine.quit()


Selenium入门03

接上一节,说一下如何进行远程测试

1、下载selenium-server-standalone的jar包
http://www.seleniumhq.org/download/

2、运行selenium-server-standalone

set JAVA_HOME=C:\NeoLanguages\Java\JDK\jdk_x86_1.8.0_77
set PATH=%JAVA_HOME%\bin;%PATH%;C:\NeoTest\TestSelenium\trunk\bin\x86\;
set webdriver.gecko.driver=C:\NeoTest\TestSelenium\trunk\bin\x86\geckodriver.exe

java -jar ../lib/selenium-server-standalone-3.3.1.jar -role standalone

pause

3、远程测试脚本
TestHelloWorldRemote.py

# !C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2016-10-22
@author: Hansen
HelloWorld sample for NeoSelenium
'''

from NeoSelenium import deInitEngine
from NeoSelenium import initEngineRemote

#一个简单的查询测试
def neohope_search_test():
    try:
        #myEngine = initEngine('ie32')
        #myEngine = initEngine('ie64')
        #myEngine = initEngine('chrome')
        #myEngine = initEngine('ff32')
        #myEngine = initEngine('ff64')
	myEngine = initEngineRemote()

        base_url = "https://www.neohope.com"
        myEngine.get(base_url + "/")
        myEngine.find_element_by_name("s").clear()
        myEngine.find_element_by_name("s").send_keys("Metabase")
        myEngine.find_element_by_css_selector("button.search-submit").click()
	myEngine.implicitly_wait(1000)
	#print(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
	queryResultLenght = len(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
	#print(queryResultLenght)
	#应该是1但现在是10
        assert queryResultLenght==1
    finally:
        #deInitEngine(myEngine)
	print("test end")

#start here
neohope_search_test()

NeoSelenium.py

#!C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2017-04-07
@author: Hansen
NeoSelenium
'''

import os
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

NPath = None
x86Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x86;"
x64Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x64;"

'''
selenium remote engine init
'''
def initEngineRemote():
    engine = webdriver.Remote(command_executor="http://192.168.130.178:4444/wd/hub", desired_capabilities=DesiredCapabilities.FIREFOX)
    return engine

'''
selenium engine deInit
'''
def deInitEngine(engine):
    engine.close()
    engine.quit()

Selenium入门02

下面就说一下如何用Python进行自动化测试咯

1、安装语言包

pip install selenium

2、在selenium网站下载对应浏览器的driver
http://www.seleniumhq.org/download/

3、改一下我写的这个文件,将driver路径改成正确的路径
NeoSelenium.py

#!C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2017-04-07
@author: Hansen
NeoSelenium
'''

import os
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

NPath = None
x86Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x86;"
x64Path = "C:\NeoTest\TestSelenium\\trunk\\bin\\x64;"

def initIE32():
    global x86Path
    global NPath
    os.environ["PATH"] = x86Path+NPath
    #print(os.environ["PATH"])
    engine = webdriver.Ie()
    return engine

def initIE64():
    global x64Path
    global NPath
    os.environ["PATH"] = x64Path+NPath
    #print(os.environ["PATH"])
    engine = webdriver.Ie()
    return engine

def initChrome32():
    global x86Path
    global NPath
    os.environ["PATH"] = x86Path+NPath
    engine = webdriver.Chrome()
    return engine

def initFirfox32():
    global x86Path
    global NPath
    os.environ["PATH"] = x86Path+NPath
    #print(os.environ["PATH"])
    engine = webdriver.Firefox()
    return engine

def initFirfox64():
    global x64Path
    global NPath
    os.environ["PATH"] = x64Path+NPath
    #print(os.environ["PATH"])
    engine = webdriver.Firefox()
    return engine

'''
selenium engine init
'''
def initEngine(engineType):
    global NPath
    if(NPath is None):
        NPath = os.environ["PATH"]
    if(cmp('IE32',engineType.upper())==0):
        return initIE32()
    elif(cmp('IE64',engineType.upper())==0):
        return initIE64()
    elif(cmp('CHROME',engineType.upper())==0 or cmp('CHROME32',engineType.upper())==0):
        return initChrome32()
    elif(cmp('FIREFOX',engineType.upper()) or cmp('FIREFOX32',engineType.upper()) or cmp('FF',engineType.upper())==0 or cmp('FF32',engineType.upper())==0):
        return initFirfox32()
    elif(cmp('FIREFOX64',engineType.upper()) or cmp('FF64',engineType.upper())==0):
        return initFirfox64()
    else:
        print("engin type: "+engineType.upper()+" not supported!")
        return None

'''
selenium remote engine init
'''
def initEngineRemote():
    engine = webdriver.Remote(command_executor="http://localhost:4444/wd/hub", desired_capabilities=DesiredCapabilities.FIREFOX)
    return engine
    

'''
selenium engine deInit
'''
def deInitEngine(engine):
    engine.close()
    engine.quit()

4、第一个自动化测试脚本
TestHelloWorld.py

# !C:\Languages\Python\Python27\python.exe
# -*- coding: utf-8 -*-
'''
Created on 2016-10-22
@author: Hansen
HelloWorld sample for NeoSelenium
'''

from NeoSelenium import initEngine
from NeoSelenium import deInitEngine

#一个简单的查询测试
def neohope_search_test():
    try:
        #myEngine = initEngine('ie32')
        #myEngine = initEngine('ie64')
        #myEngine = initEngine('chrome')
        myEngine = initEngine('ff32')
        #myEngine = initEngine('ff64')

        base_url = "https://www.neohope.com"
        myEngine.get(base_url + "/")
        myEngine.find_element_by_name("s").clear()
        myEngine.find_element_by_name("s").send_keys("Metabase")
        myEngine.find_element_by_css_selector("button.search-submit").click()
	myEngine.implicitly_wait(1000)
	#print(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
	queryResultLenght = len(myEngine.find_elements_by_xpath("//div[@id='content']/article"))
	#print(queryResultLenght)
	#应该是1但现在是10
        assert queryResultLenght==1
    finally:
        #deInitEngine(myEngine)
	print("test end")

#start here
neohope_search_test()

5、运行脚本

PS:
IE驱动抛出异常解决方案

"Unexpected error launching Internet Explorer. Protected Mode settings are not the same for all zones. Enable Protected Mode must be set to the same value (enabled or disabled) for all zones."

解决方法:

     
打开IE->Internet options->Security->Enable Protected Mode
这个框,在四个域下面要是一致的(要么都勾上,要么都不勾上)

Selenium入门01

1、常用模块介绍

Selenium IDE 是一个FF插件,用于录制测试用例并重新运行。可以保持为html脚本,也可以导出为各种语言的单元测试
Selenium Html Runner 可以直接运行Selenium IDE导出的html脚本
Selenium Standalone Server 有三种运行模式(standalone、hub、node),后两种用于grid
Selenium Remote Control Selenium RC, Selenium1采用代理网站及JS注入的方式,达到操控网页的目的,在Selenium3已经取消支持
Browser Drivers Selenium2为在不修改网页的情况下,达到操控网页的无敌,利用了各种浏览器的API,达到操控浏览器的目的
Remote Web Drivers 远程运行测试(与Selenium Standalone Server或Selenium Standalone Hub进行交互时使用)
Selenium GRID 用于同时对多个操作系统的多种浏览器进行自动化测试(包括一个HUB,和多个NODE)
Language Binding 各种开发语言包

2、Selenium IDE
2.1、FF下载插件并重启
https://addons.mozilla.org/en-US/firefox/addon/selenium-ide/
2.2、录制插件

用FF打开你要测试的网站
打开Selenium IDE
Tools->Selenium IDE
输入BaseURL,点击右侧小红点儿,开始录制
在页面上进行操作(最好不要切换页面)

2.3、保存TestSuit及TestCase

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
  <meta content="text/html; charset=UTF-8" http-equiv="content-type" />
  <title>Test Suite</title>
</head>
<body>
<table id="suiteTable" cellpadding="1" cellspacing="1" border="1" class="selenium"><tbody>
<tr><td><b>Test Suite</b></td></tr>
<tr><td><a href="neohope.case.search.html">neohope_search_testcase001</a></td></tr>
</tbody></table>
</body>
</html>

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head profile="http://selenium-ide.openqa.org/profiles/test-case">
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<link rel="selenium.base" href="https://www.neohope.com/" />
<title>neohope_search_testcase001</title>
</head>
<body>
<table cellpadding="1" cellspacing="1" border="1">
<thead>
<tr><td rowspan="1" colspan="3">neohope_search_testcase001</td></tr>
</thead><tbody>
<tr>
	<td>open</td>
	<td>/</td>
	<td></td>
</tr>
<tr>
	<td>type</td>
	<td>name=s</td>
	<td>Metabase</td>
</tr>
<tr>
	<td>clickAndWait</td>
	<td>css=button.search-submit</td>
	<td></td>
</tr>
<tr>
	<td>assertXpathCount</td>
	<td>//article</td>
	<td>1</td>
</tr>

</tbody></table>
</body>
</html>

2.4、导出python脚本
Selenium IDE->File->Export Test Case As…->Python2/WebDriver

3、用selenium-html-runner运行
3.1、下载并配置jdk
3.2、下载selenium-html-runner-3.0.1.jar
3.3、在selenium网站下载对应浏览器的driver
http://www.seleniumhq.org/download/
3.4、运行

set JAVA_HOME=C:\NeoLanguages\Java\JDK\jdk_x86_1.8.0_77
set PATH=%JAVA_HOME%\bin;%PATH%;C:\NeoTest\TestSelenium\trunk\bin\x86\;
set webdriver.gecko.driver=C:\NeoTest\TestSelenium\trunk\bin\x86\geckodriver.exe

java -jar ../lib/selenium-html-runner-3.0.1.jar -htmlSuite *firefox "https://www.neohope.com/" "../testcases/neohope.suit" "../testcases/neohope.result"
PAUSE