数据集下载

1 以太坊数据集

1.1 时序链路预测

简介

链路预测任务旨在根据观察到的信息预测给定图中链路的出现。在时序链路预测问题中,与链路没有时间戳的静态链路预测不同,我们将过去已存在的链路(带有较小的时间戳)用作训练数据,以预测将来的链路(带有较大的时间戳)的出现。

数据详情

表格简介
每一行代表了一条边信息。
属性列 (共 4 列)
from_node_num 边的起始节点序号
to_node_num 边的到达节点序号
value 交易额
timestamp 时间戳
表格简介
每一行表示把以太坊的账户(地址)映射为一个唯一的编号(ID)。
属性列 (共 2 列)
addr 以太坊的账户(地址)
idx 编号(ID)
表格简介
根据所有爬取的交易的交易时间进行排序。
属性列 (共 4 列)
From 交易发送方
To 交易接收方
Value 交易金额
Timestamp 交易时间戳
表格简介
数据集划分。加载这个pickle文件后得到一个字典类型。
属性列 (共 4 元素)
train_edges_pos 训练集中的正样本(边)元组
test_edges_pos 测试集中的正样本(边)元组
train_edges_false 训练集中的负样本(边)元组
test_edges_false 测试集中的负样本(边)元组

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

Cite

@misc{
xblockNetworkAnalysis, author = {Lin, Dan and Wu, Jiajing and Zheng, Zibin}, title = {{XBLOCK Datasets}: {InPlusLab} Blockchain Network Dataset Collection}, howpublished = {\url{http://xblock.pro/Data-Sets-details/}}, month = Nov, year = 2019 }

1.2 以太坊链上数据

简介

通过运行以太坊全节点,获取截止8099999区块的链上数据,及跟踪EVM内部调用数据,形成:

Block与NormalTransaction :在以太坊网络中,获取了8,100,000个区块与491,562,222区块中交易。

InternalEtherTransaction: 720,018个地址间发生的329,020,672笔以太币转账。

ContractInfo: 以太坊链上合约信息,共有16,609,273个智能合约被创建,触发了5,564,823次自毁操作。

ContractCall: EVM中的Call调用,共1,148,572,009次调用,其中639,336,722次包含代码调用,169,463,261次发生错误。

ERC20Transaction:ERC20标准代币转账, 42,146,575个地址间发生的227,698,645笔代币转账。

ERC721Transaction:ERC721标准代币转账, 414,829个地址间发生的7,524,827笔代币转账。

数据详情

表格简介
以太坊区块信息。
属性列 (共 14 列)
blockNumber 区块号
timestamp 时间戳
size 区块大小
difficulty 难度
transactionCount 交易数量
minerAddress 矿工地址
minerExtra 矿工Extra
gasLimit gas 上限
gasUsed 花费的gas
minGasPrice 最小gasPrice
maxGasPrice 最大gasPrice
avgGasPrice 平均gasPrice
miner 矿工地址
reward 矿工奖励
表格简介
以太坊区块中的交易信息。
属性列 (共 10 列)
blockNumber 区块号
timestamp 时间戳
transactionHash 交易哈希
from 发起地址
to 目标地址
creates 创建合约地址
value 金额
gasLimit gasLimit
gasPrice gasPrice
gasUsed gasUsed
表格简介
以太坊区块中的内部交易信息。
属性列 (共 8 列)
blockNumber 区块号
timestamp 时间戳
transactionHash 交易哈希
from 来源地址
to 目标地址
fromIsContract   来源是否为合约  
toIsContract   目标是否为合约  
value   金额  
表格简介
以太坊链上合约信息
属性列 (共 11 列)
address 合约地址
createdBlockNumber 创建区块号
createdTransactionHash 创建交易哈希
creator 创建者地址
createValue 创建时的初始金额
creationCode 合约交易创建代码
contractCode 合约运行代码
decreatedBlockNumber 自毁区块号
decreatedTransactionHash 自毁交易哈希
refunder 返现地址
refundValue 返还金额
表格简介
以太坊合约调用数据
属性列 (共 11 列)
blockNumber 调用区块号
timestamp 调用时间戳
transactionHash 调用交易哈希
from 调用发起地址
to 调用目标地址
fromIsContract 发起地址是否为合约
toIsContract 目标地址是否为合约
callType 调用类型
callingFunction 调用函数
value 调用附带金额
isError 是否发生错误
表格简介
以太坊ERC20标准代币转账的信息。
属性列 (共 7 列)
blockNumber 区块号
timestamp 时间戳
transactionHash 交易哈希
tokenAddress   代币合约地址  
from 来源地址
to 目标地址
value 金额
表格简介
以太坊ERC721标准代币转账的信息。
属性列 (共 7 列)
blockNumber 区块号
timestamp 时间戳
transactionHash 交易哈希
tokenAddress 代币合约地址
from 来源地址
to 目标地址
tokenId 代币id

下载

下载数据集。

Cite

@article{
    zheng2019xblock,
    title={Xblock-ETH: Extracting and Exploring Blockchain Data from Ethereum},
    author={Zheng, Peilin and Zheng, Zibin and Dai, Hong-ning},
    journal={arXiv preprint arXiv:1911.00169},
    year={2019}
}

1.3 智能合约庞氏骗局检测

简介

智能合约庞氏骗局检测的目标就是对于指定的合约,预测其是否是庞氏骗局。为了训练一个分类模型,我们人工检查了超过3000个合约的源码,为其贴上是否为庞氏骗局的标签。同时,我们在训练中也将用户的交易数据作为特征输入模型。

数据详情

表格简介
合约是否为庞氏骗局的标签。
属性列 (共 2 列)
Contract 合约的地址
Ponzi 合约是否为庞氏骗局 (若是则为1)

下载​

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

1.4 智能合约

简介

Open Source Contract Info.csv 数据集包括在Etherscan上公开源代码的14万个开源合约的信息。

ContractInfo.csv 数据集收集了超过1600万个以太坊链上智能合约,同时列出了智能合约的地址、创建者和字节码等属性。

数据详情

表格简介
以太坊上所有开源的合约信息。
属性列 (共 9 列)
address 开源合约地址
ContractCode 合约字节码
timestamp 合约创建时间戳
createValue 合约创建参数
createBlockNumber 合约创建时区块高度
createdTransactionHash 合约创建交易
creationCode 合约创建字节码
creator 合约创建者地址
code 合约源代码
表格简介
以太坊智能合约的信息。
属性列 (共 7 列)
address 合约地址 
createdBlockNumber 合约创建时区块高度
createdTransactionHash 合约创建交易
creator 合约创建者
createValue 合约创建参数
creationCode 合约创建字节码
contractCode 合约字节码

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

Cite

@misc{
xblockSCdataset, author = {Kong, Queping and Chen, Xiangping and Zheng, Zibin}, title = {{XBLOCK Datasets}: {InPlusLab} Ethereum Smart Contract Dataset}, howpublished = {\url{http://xblock.pro/Data-Sets-details/}}, month = Jan, year = 2020 }

1.5 以太坊钓鱼交易网络

简介

作为区块链最著名的实现,加密货币由于钓鱼诈骗而遭受了巨大的经济损失。在我们的工作中,以太坊中的账户和交易被视为节点和边,因此钓鱼账户的检测可以建模为节点分类问题。针对这一问题,我们提出了一种基于GCN和自动编码器的图卷积网络检测方法来更好地挖掘结构信息,准确区分钓鱼账户。

本工作从Etherscan 中公开的有钓鱼结点举报的结点开始,通过二阶的广度搜索从以太坊交易记录爬取了一个大型的以太坊交易网络。 数据集中包括2,973,489个结点, 13,551,303条边和1,165个含标记的结点.

数据详情

表格简介
数据不适合以图表形式展示,文字说明如下:
数据以pickle格式存储,类别是基于networkx库的图对象。
节点数量:2973489 连边数量: 13551303 平均度: 4.5574
属性列 (共 3 列)
isp 1为钓鱼标记节点,否则为0
amount 交易的数额
timestamp 交易的时间戳

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

BibTex Cite

@inproceedings {
   author ={Chen, Liang and Peng, Jiaying and Liu, Yang and Li, Jintang and Xie, Fenfang and Zheng, Zibin},
   title = {{XBLOCK Datasets}: {InPlusLab} Phishing Scams Detection in Ethereum Transaction Network},
   jouranl={Transactions on Internet Technology, submitted},
   year={2019}
}

2 比特币数据集

2.1 比特币混币服务检测

简介

由于比特币的假名性,它不太可能执行KYC进行反洗钱。然而,比特币系统上最初旨在提高交易匿名性的混币服务,已被广泛应用于洗钱上,从而使非法资金复杂化。因此,我们提供研究混合服务检测的数据集,通过分析参与比特币混合的用户,可以进一步帮助我们追捕参与犯罪活动的用户。

比特币混币服务检测任务旨在检测比特币上与混币服务有关的比特币地址。

由于比特币交易数据增长得很快,我们从2014年11月到2016年一月每隔六月截取了三个交易快照作为我们的数据集,每个快照包含了1,500,000条交易记录。

数据详情

表格简介
区块信息。
属性列 (共 4 列)
blockID 区块ID
bhash 区块哈希
btime 区块创建时间
txs 交易数
表格简介
交易ID和交易哈希。
属性列 (共 2 列)
txID 交易ID
txhash 交易哈希
表格简介
比特币ID和比特币地址。
属性列 (共 2 列)
addrID 比特币ID
addr 比特币地址
表格简介
交易信息。
属性列 (共 5 列)
txID 交易 ID
blockID 区块ID
n_inputs 输入数量
n_outputs 输出数量
btime 区块创建时间
表格简介
交易输入列表。
属性列 (共 3 列)
txID 交易ID
addrID 输入地址
value 交易金额 (以Satoshis(1e-8 BTC)为单位)
表格简介
交易输出列表。
属性列 (共 3 列)
txID 交易ID
addrID 接收地址
value 交易金额 (以Satoshis(1e-8 BTC)为单位)
表格简介
label.rar 包含了38个文件,文件结构可以参考 BitMixer.io.csv。 这些文件包含的地址来自于从 walletexplorer爬取的 BitMixer.io, BitLaunder.com, BitcoinFog, HelixMixer 四个混币服务的信息。
属性列 (共 1 列)
Address 属于这个混币服务的地址(按’\n’分离)

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集

Cite

@misc{
xblockNetworkAnalysis, author = {Liu, Jieli and Wu, Jiajing and Zheng, Zibin}, title = {{XBLOCK Datasets}: {InPlusLab} Blockchain Network Dataset Collection}, howpublished = {\url{http://xblock.pro/Data-Sets-details/}}, month = Jan, year = 2020 }

2.2 Mt.Gox 泄露交易数据

简介

该数据集为Mt.gox交易所泄露的交易数据,我们首先合并了同一交易的买和卖的交易字段后,然后通过交易时间、交易账户等进行了去重,确保了每条交易数据的唯一性。该交易数据对于分析比特币交易市场的用户行为大有用处。

数据详情

表格简介
比特币市场交易数据。
数学列 (共 8 列)
Source 出售比特币的用户
Target 购买比特币的用户
Trade_Id 当前交易的Id
Bitcoins 本次交易涉及的比特币数量
Money 购买比特币的美元
Money_rate 比特币价格
Date 交易日期
label 类型的用户

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

BibTex Cite

@inproceedings{
chen2019market, title={Market Manipulation of Bitcoin: Evidence from Mining the Mt. Gox Transaction Network}, author={Chen, Weili and Wu, Jun and Zheng, Zibin and Chen, Chuan and Zhou, Yuren}, booktitle={IEEE Conference on Computer Communications}, pages={964--972}, year={2019}, organization={IEEE} }

3 EOS数据集

3.1 DApps活跃度

简介

在诸如以太坊、EOS、Steem等平台上有许多DApp,其中有一些DApp处于活跃状态(也就是说还有新交易在产生),另一些则在很长时间内都没有活跃。
本数据集包含两个子数据集,一是DappRadar市场上的DApp活跃度数据,二是State of the DApps市场上的DApp活跃度数据。活跃度数据包含了各个DApp在24小时、7天、30天内的活跃度信息,如交易量、交易额、活跃用户数量等。

数据详情

表格简介
DappRadar市场的DApps活跃度信息。
属性列 (共 15 列)
Txs_24h 该DApp最近24小时的交易量
Txs_7d 该DApp最近7天的交易量
balance 余额
category 类别
link DApp的链接
name DApp的名称
protocol DApp的协议
rank DApp排名,可以用来唯一标识DApp
users_24h 最近24小时内的活跃用户数量
volume_24h 最近24小时的交易额
volume_7d 最近7天的交易额
long_intro 完整介绍
other_link 其他链接
submitted 提交时间
contract 包含的合约
表格简介
DApps市场中的DApps活跃度信息。
属性列 (共 28 列)
category 类别
dev_activity_30d 30天内开发活跃
link 链接
name DApp的名称
platform 所属平台
rank DApp排名,可以用来唯一标识DApp
users_24h 最近24小时内的活跃用户数量
volume_7d 最近7天的交易额
short_intro 简介
long_intro 完整介绍
status 状态
author 作者(可能有多个)
software_license 许可证
submitted_updated 提交时间
mainnet 主网
contract 包含的合约地址
tag DApp的标签
last_updated 最近更新的日期
transaction_count 交易数量
transaction_count_volume_greater_0 非零交易数量
transaction_count_ratio 非零交易所占全部交易的比重
total_transaction_volume_ether 总交易额,以ether为单位
contract_count 合约数量
dapp_total_loss DApp用户的净收入
user_count_unique_remove_contract_creator 不重复的合约创建者数量
user_total_loss 普通用户的净收入
user_loss_ratio 用户净收入比重
user_loss_average 平均净收入

下载

您可以从README中了解更多关于数据集的可靠性、可用性和及时性的信息。

下载数据集。

BibTex Cite

@inproceedings {
   author ={Chen, Liang and Peng, Jiaying and Liu, Yang and Li, Jintang and Xie, Fenfang and Zheng, Zibin},
   title = {{XBLOCK Datasets}: {InPlusLab} Phishing Scams Detection in Ethereum Transaction Network},
   jouranl={Transactions on Internet Technology, submitted},
   year={2019}
}