Upgrade to Pro — share decks privately, control downloads, hide ads and more …

GitRadar——毕业论文答辩

 GitRadar——毕业论文答辩

Avatar for Shuai Liu

Shuai Liu

June 30, 2014
Tweet

More Decks by Shuai Liu

Other Decks in Programming

Transcript

  1. 基于GitHub开放数据的   开发者能力评价系统   刘帅     1103710207   指导教师

      计算机科学与技术学院  吴晋   的设计与实现
  2. 内容提要 •  项目来源 &  背景   •  需求分析   • 

    系统设计 &  实现   •  运行结果 &  性能分析   •  结论  
  3. 非功能需求 •  性能   •  数据处理   •  网络访问  

    •  可靠性   •  数据的可靠性   •  系统的可用性
  4. GitHub上开发者评价模型设计 开发者 对 软件项目 做了操作 做了什么 软件项目 开发者 项目被star的个数 ×

     star权重 +  项目被fork个数 ×  fork权重 PushEvent、 IssueEvent、PullRequestEvent 截止到某一时间点开发者的所有行为价值之和
  5. 总体实现方案 •  Python     •  Node.js   •  MongoDB

     +  Redis   •  并发操作的实现:多进程 +  协程   •  gevent  +  whoosh  +  Fluentd  +  SemanHc-­‐UI  +  mapbox.js  +  high-­‐charts  
  6. 性能测试 •  每天行为总数量:50万(平均每小时2万)   •  经过数据清洗后:12万(平均每小时5000)   •  调用地名规范化的Web  Service次数:≤800

      •  缓存命中次数:≥7.5万,缓存数量:2.4万,命中率:98%   •  平均每天数据处理所需时间:约300秒