Million Song Dataset

O Million Song Dataset é uma coleção de recursos e metadados de áudio disponíveis gratuitamente para um milhão de faixas de música popular contemporânea.

Seus objetivos são:

  • Incentivar a pesquisa de algoritmos que se dimensionam para tamanhos comerciais.
  • Fornecer um conjunto de dados de referência para avaliar a pesquisa.
  • Como alternativa de atalho para a criação de um grande conjunto de dados com APIs (por exemplo, The Echo Nest)
  • Ajudar novos pesquisadores a começar no campo MIR.

O núcleo do conjunto de dados é a análise de recursos e os metadados de um milhão de músicas, fornecidos pelo The Echo Nest. O conjunto de dados não inclui nenhum áudio, apenas os recursos derivados. Observe, no entanto, que amostra de áudio pode ser obtida em serviços como 7digital, usando o código que fornecemos.

O Million Song Dataset também é um cluster de conjuntos de dados complementares contribuídos pela comunidade:

  • Conjunto de dados SecondHandSongs -> músicas cover
  • Conjunto de dados musiXmatch -> letra
  • Conjunto de dados da Last.fm -> tags e semelhanças no nível da música
  • Subconjunto Taste Profile -> dados do usuário
  • Mapeamento thisismyjam-to-MSD -> mais dados do usuário
  • Anotações de gênero tagtraum -> rótulos de gênero
  • Principais conjuntos de dados MAGD -> mais rótulos de gênero

O Million Song Dataset começou como um projeto colaborativo entre The Echo Nest e LabROSA. Foi apoiado em parte pela NSF.

Dados e recursos

Informações Adicionais

Campo Valor
Última Atualização 3 de Novembro de 2019, 03:06 (UTC)
Criado 3 de Novembro de 2019, 03:05 (UTC)
API Não
Datas -
Grátis Sim
IP brasileiro Não
Língua Inglês
Microdados Sim
Nível da observação música, álbum, banda
Periodicidade -