LlamaIndex

Integre o Firecrawl ao LlamaIndex para criar aplicações de IA com busca vetorial e embeddings baseados em conteúdo da web.

Configuração

npm install llamaindex @llamaindex/openai @mendable/firecrawl-js

Crie o arquivo .env:

FIRECRAWL_API_KEY=sua_chave_firecrawl
OPENAI_API_KEY=sua_chave_openai

Observação: Se estiver usando Node < 20, instale dotenv e adicione import 'dotenv/config' ao seu código.

RAG com Busca Vetorial

Este exemplo demonstra como usar LlamaIndex com Firecrawl para rastrear um site, criar embeddings e consultar o conteúdo por meio de RAG.

import Firecrawl from '@mendable/firecrawl-js';
import { Document, VectorStoreIndex, Settings } from 'llamaindex';
import { OpenAI, OpenAIEmbedding } from '@llamaindex/openai';

Settings.llm = new OpenAI({ model: "gpt-4o" });
Settings.embedModel = new OpenAIEmbedding({ model: "text-embedding-3-small" });

const firecrawl = new Firecrawl({ apiKey: process.env.FIRECRAWL_API_KEY });
const crawlResult = await firecrawl.crawl('https://firecrawl.dev', {
  limit: 10,
  scrapeOptions: { formats: ['markdown'] }
});
console.log(`Crawled ${crawlResult.data.length } pages`);

const documents = crawlResult.data.map((page: any, i: number) =>
  new Document({
    text: page.markdown,
    id_: `page-${i}`,
    metadata: { url: page.metadata?.sourceURL }
  })
);

const index = await VectorStoreIndex.fromDocuments(documents);
console.log('Vector index created with embeddings');

const queryEngine = index.asQueryEngine();
const response = await queryEngine.query({ query: 'What is Firecrawl and how does it work?' });

console.log('\nAnswer:', response.toString());

Para mais exemplos, consulte a documentação do LlamaIndex.

Primeiros passos

Novos recursos

Recursos padrão

Webhooks

Guias para desenvolvedores

Casos de uso

Como contribuir

Configuração

RAG com Busca Vetorial

Primeiros passos

Novos recursos

Recursos padrão

Webhooks

Guias para desenvolvedores

Casos de uso

Como contribuir

​Configuração

​RAG com Busca Vetorial

Configuração

RAG com Busca Vetorial