forked from huxiaoqian/case
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathevolution-data_source_save.txt
70 lines (59 loc) · 2.79 KB
/
evolution-data_source_save.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
数据来源及数据存储形式说明
cron/evolution代码库完成了地域模块的计算,其数据来源以及输出数据存储形式、路径说明如下:
1 微博通道
1)数据来源说明:
微博话题名 --
mongodb (host=219.224.135.47 port=27019)
db: 54api_weibo_v2
话题名collection: master_timeline_topic
微博数据 --
xapian (host=219.224.135.48)
路径: /home/xapian/xapian_weibo_topic
xapian名称形式: 'xapian_weibo_topic_' + weibo_topic_id
(weibo_topic_id对应于mongodb中master_timeline_topic中话题id)
查询形式: 通过/home/xapian/xapian_weibo_topic/stub/ 中的stub文件获取
mongodb (host=219.224.135.47 port=27019) - (注:创建xapian用)
db: 54api_weibo_v2
话题名collection: 'master_timeline_weibo_topic_' + topic_id
(topic_id对应于master_timeline_topic中话题id)
微博用户信息 --
xapian (host=219.224.135.48)
路径: /home/xapian/xapian_user/
mongodb (host=219.224.135.47 port=27019)
db: 54api_weibo_v2
用户信息collection: master_timeline_user
2) 输出数据说明:
微博地域转发关系
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_repost表
微博数量(按地域)
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_topic_count表
热门微博
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_weibos表
2 新闻通道
1)数据来源说明:
mongodb (host=219.224.135.47 port=27019)
db: news
新闻话题名称collection: news_topic
话题新闻内容collection: 'post_' + news_topic_id
(news_topic_id对应于news_topic中话题id)
话题评论内容collection: 'comment_' + news_id
(news_id对应于一条新闻的id)
2) 输出数据说明:
新闻地域转发关系
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_repost_news表
新闻数量(按地域)
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_topic_count_news表
热门新闻
存储路径: mysql(host=219.224.135.47)
db: weibocase
存储形式: city_news表