1. 总体策略与目标(概要)
目标:建立可检索、可审计、便于关联服务器配置与网络状态的照片档案管理体系。
范围:机房内部照片、机柜标签、服务器面板、交换机端口、光纤跳线与PDU。
成果:为巡检、变更单与事故响应提供对应照片证据与时间线。
指标:照片命名规范、EXIF时间与定位、MD5指纹、每月重复率低于2%。
责任:运维工程师负责拍摄并上传,资产管理员审核并归档。
关联:照片档案需关联工单号、服务器(IP/主机名)、域名、CDN配置与DDoS防护记录。
2. 文件命名与目录结构(标准示例)
建议命名格式:YYYYMMDD_DC_SITE_Rx_Sv_JP_IMGnn.jpg,例如:20260421_KUL_DC1_R12_SRV01_IMG001.jpg。
目录结构示例:/archive/2026/04/KUL_DC1/R12/,按年/月/站点/机柜分层存放。
每张图片同时保存一份 .json 元数据文件,字段包含md5、sha1、exif时间、设备型号。
命名要包含工单号:20260421_TKT12345_KUL_DC1_R12_SRV01_IMG001.jpg,便于追溯变更。
对于VPS/云主机截图,使用实例ID与公网IP:20260421_VPS_VM-202_203.0.113.10_IMG001.png。
所有文件名均使用ASCII字符以兼容跨平台同步与备份。
3. 元数据提取与去重策略(工具与命令)
推荐工具:exiftool 提取 EXIF、ImageMagick 生成缩略图、md5sum 做指纹。
示例命令:exiftool -json 20260421_KUL_DC1_R12_SRV01_IMG001.jpg > 20260421_KUL_DC1_R12_SRV01_IMG001.json。
指纹示例:md5sum 20260421_KUL_DC1_R12_SRV01_IMG001.jpg 输出 e2c569be17396eca2a2e3c11578123ed。
去重策略:若 MD5 相同且 EXIF 时间、分辨率一致,则判定为重复,保留最新工单关联记录。
批量处理建议:cron 作业每日跑一次,统计新增、重复与异常(缺少 EXIF 或时间不符)。
异常处理:缺EXIF的图片标记为需手动确认,并由巡检填写拍摄设备与时间。
4. 表格示例:照片档案记录与服务器配置对应(样表)
下表展示典型照片档案条目与对应服务器/主机配置,便于巡检时快速定位设备与网络信息。
| 文件名 |
拍摄时间 |
机柜/机位 |
服务器型号 |
公网IP |
备注 |
| 20260421_KUL_DC1_R12_SRV01_IMG001.jpg |
2026-04-21 09:12:45 |
R12/U3 |
Dell R630 / 2x E5-2620 v4 / 64GB / 2x480GB RAID1 |
203.0.113.10 |
Web 前端,使用 Cloudflare CDN,已启用 DDoS 防护 |
| 20260421_KUL_DC1_R12_SW01_IMG002.jpg |
2026-04-21 09:14:03 |
R12/SW |
Cisco Nexus 93180YC |
— |
上联 10Gbps 到骨干 BGP,VLAN 100/200 |
| 20260305_KUL_DC2_R05_VPS_IMG001.png |
2026-03-05 16:02:12 |
虚拟 |
VPS 2vCPU / 4GB / 80GB SSD |
203.0.113.45 |
应用服务器,绑定域名 app.example.my,使用 CDN 缓存 |
说明:表中服务器型号与IP为示例,表格居中且单元格文本均居中,方便打印与导出为 PDF。
5. 关联运维记录与巡检流程(实践步骤)
拍照前在工单系统中记录工单号、目标设备与期望检查项。
拍照时在照片内包含工单号纸条或通过拍摄控制台截图以做双重验证。
上传时强制填写表单字段:拍摄人、拍摄设备、拍摄时间(若无EXIF)、机柜位置。
自动化:上传触发 Lambda/脚本解析EXIF并写入 CMDB(关联主机名、IP、资产编号)。
巡检结束后由资产管理员对照片日志进行审计并关联到变更单或事故单。
6. 与 CDN、DDoS、域名的联动记录(关键点)
当照片显示外链/配置变更(如证书、反向代理)时须记录域名与证书指纹。
CDN 示例:Cloudflare 使用 Page Rules、缓存 TTL 与证书状态截图并入档。
DDoS 防护示例:在事件记录中附上 Mitigation Provider(Cloudflare/Arbor)控制台截图与流量峰值数据。
网络口径数据:记录上联带宽(例:10Gbps 上联,常态流量 150Mbps,峰值 2.3Gbps)。
BGP/ASN 信息:记录本地 ASN,若因攻击需要切换清洗服务,保存对应控制台操作照片与工单。
7. 真实案例:吉隆坡机房一次巡检与故障定位(含配置数据)
背景:2026-03-18,为客户 A 在吉隆坡数据中心(KUL_DC1)做负载均衡故障排查。
发现:巡检照片显示 R12 机柜 U3 服务器网线异常,照片命名 20260318_TKT8421_KUL_R12_U3_IMG003.jpg。
服务器配置:Dell R630,CPU 2x E5-2620 v4 (8C/16T each),内存 64GB,OS Ubuntu 20.04,公网 203.0.113.10,Nginx 1.22。
处理:通过照片确认网线为接到备用交换机端口,联动网络工程替换回主网口并重启交换机端口;同时在 CDN 控制台清空缓存并回滚 WAF 规则。
结果:服务恢复,工单 TKT8421 完成,所有巡检照片、交换机端口配置截图、流量曲线(峰值 1.4Gbps)均归入该工单档案。
来源:如何整理马来西亚机房照片档案便于巡检与运维记录管理