O potencial da pista de dados de IA e a ascensão do Web3 DataFi
Recentemente, o evento mais notável no mundo da IA foi a impressionante demonstração de força da Meta. Mark Zuckerberg está recrutando talentos por toda parte, formando uma equipe luxuosa de IA composta principalmente por talentos de pesquisa chineses. Entre eles, Alexander Wang, de apenas 28 anos, tornou-se o líder. Wang fundou a Scale AI, que está avaliada em 29 bilhões de dólares, fornecendo serviços de dados para várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta. O negócio principal da Scale AI é fornecer grandes quantidades de dados rotulados precisos.
A razão pela qual a Scale AI conseguiu destacar-se entre as muitas unicórnios é que reconheceu cedo a importância dos dados na indústria de IA. O poder de cálculo, os modelos e os dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder de cálculo é a comida e os dados são o conhecimento e a informação.
No rápido desenvolvimento dos grandes modelos de linguagem, o foco da indústria passou da modelagem para a capacidade de computação. Hoje em dia, a maioria dos modelos utiliza o transformer como estrutura, com inovações ocasionais como MoE ou MoRe. Os grandes gigantes ou constroem seus próprios clusters de supercomputação ou assinam acordos de longo prazo com provedores de serviços em nuvem como a AWS. Após resolver o problema da capacidade de computação, a importância dos dados começou a se destacar.
Ao contrário das tradicionais empresas de big data B2B, a Scale AI dedica-se a construir uma base de dados sólida para modelos de IA. Seus negócios incluem não apenas a mineração de dados existentes, mas também a geração de dados a longo prazo. A empresa também formou uma equipe de treinamento de IA composta por especialistas humanos de diferentes áreas, para fornecer dados de treinamento de maior qualidade para os modelos de IA.
O treinamento do modelo é dividido em duas fases: pré-treinamento e ajuste fino. A fase de pré-treinamento é semelhante ao processo de aprendizagem de uma criança ao aprender a falar, necessitando da entrada de uma grande quantidade de textos, códigos e outras informações coletadas da internet para o modelo de IA. A fase de ajuste fino é semelhante à educação escolar, geralmente com respostas e direções claras de certo e errado. Através de conjuntos de dados específicos, podemos desenvolver as habilidades necessárias no modelo.
Assim, os dados necessários também se dividem em duas categorias: uma é uma grande quantidade de dados que não requer muita manipulação, geralmente provenientes de dados de rastreamento de plataformas UGC como Reddit, Twitter, Github, bancos de dados de literatura pública e bancos de dados privados de empresas; a outra categoria requer um design e seleção cuidadosos para cultivar determinadas qualidades excelentes do modelo, o que exige trabalho de limpeza, seleção, anotação de dados e feedback humano.
À medida que a capacidade dos modelos aumenta, diversos conjuntos de dados de treinamento mais finos e especializados se tornarão fatores-chave que influenciam a capacidade dos modelos. A longo prazo, os dados de IA também constituem uma pista de longo prazo com capacidade de acumulação exponencial; com a acumulação de trabalho inicial, os ativos de dados terão capacidade de juros compostos, tornando-se mais valiosos com o tempo.
No domínio do Web3, o conceito de DataFi surgiu. O Web3 DataFi possui várias vantagens:
Os contratos inteligentes garantem a soberania, segurança e privacidade dos dados.
Vantagens naturais de arbitragem geográfica atraem a força de trabalho distribuída global mais adequada.
Vantagens claras de incentivo e liquidação da blockchain
Contribui para a construção de um mercado de dados "one-stop" mais eficiente e aberto
Para os utilizadores comuns, o DataFi é o projeto de IA descentralizada mais favorável à participação. Os utilizadores não precisam assinar contratos de fábrica de dados, basta fazer login na carteira para participar ao completar várias tarefas simples, como fornecer dados, avaliar modelos, utilizar ferramentas de IA para criações simples ou participar em transações de dados.
Atualmente, o campo do Web3 DataFi já viu surgir um conjunto de projetos promissores, como Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO e Gata. Esses projetos se concentram em diferentes áreas de serviços de dados, incluindo coleta de dados, avaliação de modelos, monetização de dados pessoais, indexação de dados em blockchain, entre outros.
Embora as barreiras para esses projetos atualmente não sejam muito altas, uma vez que acumulem usuários e uma adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Assim, os projetos iniciais devem concentrar-se em incentivos e na experiência do usuário. Ao mesmo tempo, essas plataformas de dados também precisam considerar como gerenciar a mão de obra e garantir a qualidade da produção de dados, evitando a situação em que moedas de baixa qualidade expulsem as de alta qualidade.
Além disso, aumentar a transparência é também um desafio importante que os projetos em blockchain enfrentam atualmente. Cada vez mais, os projetos precisam demonstrar um compromisso a longo prazo que seja público e transparente, para promover o desenvolvimento saudável do Web3 DataFi.
O caminho de aplicação em larga escala do DataFi inclui dois aspectos: primeiro, atrair um número suficiente de usuários comuns para participar da coleta e geração de dados, formando um grupo de consumidores da economia de IA; em segundo lugar, obter o reconhecimento das principais grandes empresas, pois a curto prazo elas ainda são a principal fonte de grandes contratos de dados.
De um modo geral, o DataFi representa o processo em que a inteligência humana cultiva a inteligência das máquinas ao longo do tempo, enquanto garante, através de contratos inteligentes, os rendimentos do trabalho humano, culminando na retribuição da inteligência das máquinas para os humanos. Para aqueles que estão cheios de incertezas sobre a era da IA, juntar-se ao DataFi é uma escolha sábia que se alinha com as tendências.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
11 Curtidas
Recompensa
11
4
Repostar
Compartilhar
Comentário
0/400
TommyTeacher1
· 14h atrás
O irmão que faz dinheiro, leva-me a voar.
Ver originalResponder0
FOMOmonster
· 14h atrás
28 já vale bilhões, fiquei impactado.
Ver originalResponder0
LidoStakeAddict
· 14h atrás
Com 28 anos, a avaliação já é de 29 bilhões. Não dá para ficar parado.
Ver originalResponder0
MetaReckt
· 14h atrás
Zack está a fazer tanto alvoroço, a aprender com a Huawei a recrutar pessoas.
A ascensão do Web3 DataFi: o potencial ilimitado da pista de dados de IA
O potencial da pista de dados de IA e a ascensão do Web3 DataFi
Recentemente, o evento mais notável no mundo da IA foi a impressionante demonstração de força da Meta. Mark Zuckerberg está recrutando talentos por toda parte, formando uma equipe luxuosa de IA composta principalmente por talentos de pesquisa chineses. Entre eles, Alexander Wang, de apenas 28 anos, tornou-se o líder. Wang fundou a Scale AI, que está avaliada em 29 bilhões de dólares, fornecendo serviços de dados para várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta. O negócio principal da Scale AI é fornecer grandes quantidades de dados rotulados precisos.
A razão pela qual a Scale AI conseguiu destacar-se entre as muitas unicórnios é que reconheceu cedo a importância dos dados na indústria de IA. O poder de cálculo, os modelos e os dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder de cálculo é a comida e os dados são o conhecimento e a informação.
No rápido desenvolvimento dos grandes modelos de linguagem, o foco da indústria passou da modelagem para a capacidade de computação. Hoje em dia, a maioria dos modelos utiliza o transformer como estrutura, com inovações ocasionais como MoE ou MoRe. Os grandes gigantes ou constroem seus próprios clusters de supercomputação ou assinam acordos de longo prazo com provedores de serviços em nuvem como a AWS. Após resolver o problema da capacidade de computação, a importância dos dados começou a se destacar.
Ao contrário das tradicionais empresas de big data B2B, a Scale AI dedica-se a construir uma base de dados sólida para modelos de IA. Seus negócios incluem não apenas a mineração de dados existentes, mas também a geração de dados a longo prazo. A empresa também formou uma equipe de treinamento de IA composta por especialistas humanos de diferentes áreas, para fornecer dados de treinamento de maior qualidade para os modelos de IA.
O treinamento do modelo é dividido em duas fases: pré-treinamento e ajuste fino. A fase de pré-treinamento é semelhante ao processo de aprendizagem de uma criança ao aprender a falar, necessitando da entrada de uma grande quantidade de textos, códigos e outras informações coletadas da internet para o modelo de IA. A fase de ajuste fino é semelhante à educação escolar, geralmente com respostas e direções claras de certo e errado. Através de conjuntos de dados específicos, podemos desenvolver as habilidades necessárias no modelo.
Assim, os dados necessários também se dividem em duas categorias: uma é uma grande quantidade de dados que não requer muita manipulação, geralmente provenientes de dados de rastreamento de plataformas UGC como Reddit, Twitter, Github, bancos de dados de literatura pública e bancos de dados privados de empresas; a outra categoria requer um design e seleção cuidadosos para cultivar determinadas qualidades excelentes do modelo, o que exige trabalho de limpeza, seleção, anotação de dados e feedback humano.
À medida que a capacidade dos modelos aumenta, diversos conjuntos de dados de treinamento mais finos e especializados se tornarão fatores-chave que influenciam a capacidade dos modelos. A longo prazo, os dados de IA também constituem uma pista de longo prazo com capacidade de acumulação exponencial; com a acumulação de trabalho inicial, os ativos de dados terão capacidade de juros compostos, tornando-se mais valiosos com o tempo.
No domínio do Web3, o conceito de DataFi surgiu. O Web3 DataFi possui várias vantagens:
Para os utilizadores comuns, o DataFi é o projeto de IA descentralizada mais favorável à participação. Os utilizadores não precisam assinar contratos de fábrica de dados, basta fazer login na carteira para participar ao completar várias tarefas simples, como fornecer dados, avaliar modelos, utilizar ferramentas de IA para criações simples ou participar em transações de dados.
Atualmente, o campo do Web3 DataFi já viu surgir um conjunto de projetos promissores, como Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO e Gata. Esses projetos se concentram em diferentes áreas de serviços de dados, incluindo coleta de dados, avaliação de modelos, monetização de dados pessoais, indexação de dados em blockchain, entre outros.
Embora as barreiras para esses projetos atualmente não sejam muito altas, uma vez que acumulem usuários e uma adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Assim, os projetos iniciais devem concentrar-se em incentivos e na experiência do usuário. Ao mesmo tempo, essas plataformas de dados também precisam considerar como gerenciar a mão de obra e garantir a qualidade da produção de dados, evitando a situação em que moedas de baixa qualidade expulsem as de alta qualidade.
Além disso, aumentar a transparência é também um desafio importante que os projetos em blockchain enfrentam atualmente. Cada vez mais, os projetos precisam demonstrar um compromisso a longo prazo que seja público e transparente, para promover o desenvolvimento saudável do Web3 DataFi.
O caminho de aplicação em larga escala do DataFi inclui dois aspectos: primeiro, atrair um número suficiente de usuários comuns para participar da coleta e geração de dados, formando um grupo de consumidores da economia de IA; em segundo lugar, obter o reconhecimento das principais grandes empresas, pois a curto prazo elas ainda são a principal fonte de grandes contratos de dados.
De um modo geral, o DataFi representa o processo em que a inteligência humana cultiva a inteligência das máquinas ao longo do tempo, enquanto garante, através de contratos inteligentes, os rendimentos do trabalho humano, culminando na retribuição da inteligência das máquinas para os humanos. Para aqueles que estão cheios de incertezas sobre a era da IA, juntar-se ao DataFi é uma escolha sábia que se alinha com as tendências.