Contador de Palavras
Estatísticas de texto em tempo real: caracteres, palavras, linhas, parágrafos e mais
Estatísticas Básicas
Estatísticas de Estrutura
Estimativa de Leitura
O que é Contador de Palavras?
Contador de Palavras é uma ferramenta para estatísticas de texto em tempo real incluindo contagem de caracteres, contagem de palavras, contagem de linhas e mais. Seja escrevendo artigos, papers, comentários de código ou conteúdo de mídia social, esta ferramenta ajuda você a entender rapidamente seu texto. Esta ferramenta suporta texto misto chinês e inglês, inteligentemente reconhecendo caracteres chineses e palavras inglesas para contagem separada. Também fornece estimativas de tempo de leitura para ajudar você a entender quanto tempo leva para leitores terminar seu conteúdo. Em conteúdo publicado ou multilíngue, revise idioma, conjunto de caracteres, contexto e casos de borda antes de reutilizar.
Como usar
Operações Básicas
- Digite ou cole seu texto na caixa de texto à esquerda
- As estatísticas são atualizadas em tempo real no painel à direita
- Ajuste as opções conforme necessário (pontuação, quebras de linha, etc.)
- Limpe, cole ou copie o texto a qualquer momento
Regras de Contagem
- Total de caracteres: todos os caracteres, incluindo espaços, pontuação e quebras de linha
- Caracteres chineses: conta todos os caracteres chineses (CJK)
- Palavras em inglês: conta palavras compostas por letras
- Parágrafos: blocos de texto não vazios separados por linhas em branco
- Velocidade de leitura: 350 caracteres/min para chinês, 225 palavras/min para inglês
Casos de uso
Princípio técnico
A contagem de palavras separa por espaços em branco Unicode usando uma expressão regular próxima de `text.trim().split(/\s+/).filter(Boolean)` para scripts latinos, que corresponde a espaços ASCII, tabulações, quebras de linha e separadores Unicode como U+00A0 (espaço sem quebra) e U+2028 (separador de linha). Essa regra funciona para inglês, francês, alemão e outros idiomas separados por espaço, mas falha para chinês, japonês e tailandês, onde não há espaço em branco entre palavras. O texto CJK é então contado por caractere: `[...text].length` em vez de `text.length`, porque o operador spread itera pontos de código Unicode e lida corretamente com pares substitutos para caracteres acima de U+FFFF (ex.: Ideogramas Unificados CJK Extensão B a partir de U+20000 e a maioria dos emoji em U+1F300+). A classe de caracteres CJK é detectada com o escape de propriedade Unicode `/\p{Script=Han}/u` para ideogramas chineses. A propriedade `length` de uma string JavaScript conta unidades de código UTF-16, não caracteres, então `'👨👩👧'.length === 8` enquanto o glifo visível é um cluster de grafemas composto por três emoji unidos por U+200D Zero-Width Joiner. A contagem precisa usa `Intl.Segmenter('en', { granularity: 'grapheme' })`, disponível em todos os navegadores modernos desde 2023; para segmentação em nível de palavra em qualquer idioma, incluindo CJK, `Intl.Segmenter(locale, { granularity: 'word' })` segue o Anexo #29 do Padrão Unicode e é a opção mais correta quando disponível. Limites de frase são detectados por `[.!?…。!?]+` seguido de espaço em branco ou fim da string, e parágrafos por duas ou mais quebras de linha consecutivas (`/\n\s*\n/`). As estimativas de leitura e fala aplicam constantes publicadas de velocidade de leitura. A meta-análise de Brysbaert (2019) aponta leitura silenciosa de adultos a 238 palavras por minuto para não-ficção em inglês, razão pela qual 225-250 wpm é o padrão comum de interface. A leitura silenciosa em chinês é em média 350-500 caracteres por minuto. O ritmo de fala é mais lento: palestras TED têm média de 163 wpm, e narração de audiolivros visa 150-160 wpm. O limite de 280 caracteres do Twitter conta CJK e a maioria dos emoji como 2 caracteres ponderados via sua biblioteca `twitter-text`, enquanto um par de indicadores regionais (emoji de bandeira de país) conta como 4 unidades de código UTF-16 no `.length` bruto.
- Separação por espaço em branco: `text.trim().split(/\s+/).filter(Boolean)` funciona para scripts latinos; falha em CJK e tailandês que não têm espaços entre palavras.
- Contagem de caracteres CJK usa `[...text].length` para iterar pontos de código Unicode corretamente (lida com pares substitutos acima de U+FFFF, ex.: ideogramas estendidos e emoji).
- `string.length` retorna unidades de código UTF-16, não grafemas: um emoji de família 👨👩👧 tem `.length === 8` mas é um único caractere visível.
- Segmentação mais precisa: `Intl.Segmenter(locale, { granularity: 'word' | 'grapheme' })` implementa o Anexo #29 do Padrão Unicode.
- Velocidades de leitura padrão: inglês 225-250 wpm silencioso (Brysbaert 2019), chinês 350-500 caracteres/min; fala 150-160 wpm para narração, 163 wpm para média TED.
- Separação de frases: `[.!?…。!?]+\s+`; separação de parágrafos: `\n\s*\n`; contagem de linhas: `text.split('\n').length`.
- O Twitter pondera CJK e a maioria dos emoji como 2 caracteres contra o limite de 280 via `twitter-text`; um emoji de bandeira (par de indicadores regionais) tem `.length === 4` em UTF-16 bruto.
Exemplos
Frase curta em inglês
Entrada: Hello world, this is a test.
Total de caracteres: 28
Caracteres (sem espaços): 23
Palavras: 6
Frases: 1
Tempo de leitura: ~2 segundos (225 wpm)Texto misto em chinês e inglês
Entrada: Hello 你好世界, this is ToolAct.
Total de caracteres: 28
Caracteres chineses: 4 (你好世界)
Palavras em inglês: 4 (Hello, this, is, ToolAct)
Números: 0Postagem no Twitter dentro do limite de 280 caracteres
Rascunho: Launching a new browser-only toolbox today — 112 dev tools,
zero uploads, zero tracking. Check it out at toolact.com.
Total de caracteres: 124 (dentro do limite de 280 caracteres do Twitter)
Palavras: 22
Linhas: 2Estimar um discurso de 5 minutos
Roteiro: ~750 palavras em inglês
Tempo de leitura: 3 min 20 seg (225 wpm leitura silenciosa)
Tempo de fala: 5 min 0 seg (150 wpm ritmo de fala)
Parágrafos: 5 | Frases: 42Verificar comprimento da meta description para SEO
Title: "ToolAct - 112 Online Developer Tools, Free and Private"
-> 56 caracteres (Google exibe ~60)
Description: "Format JSON, convert timestamps, generate cron expressions,
and run 100+ more dev tools right in your browser. No uploads."
-> 148 caracteres (Google exibe ~155)Perguntas frequentes
O que o contador mede?
Total de caracteres, caracteres sem espaços, caracteres chineses, palavras em inglês, números, linhas, parágrafos, frases e tempo estimado de leitura/fala. Tudo é atualizado em tempo real conforme você digita ou cola.
Como as 'palavras' são definidas?
Palavras em inglês são sequências de letras separadas por espaços em branco. Os caracteres chineses são detectados pelas faixas Unicode CJK e contados individualmente. Números e símbolos são incluídos nas contagens totais de caracteres.
Como o tempo de leitura é calculado?
Padrão de 200 a 250 palavras por minuto, a média da leitura silenciosa de um adulto. A velocidade de fala é mais lenta (~150 ppm); a leitura dinâmica é mais rápida (300-400 ppm). O número é uma estimativa aproximada — o tempo real depende da densidade do conteúdo e da experiência do leitor.
Emojis e caracteres especiais são contados?
Sim, mas observe que um emoji como 😀 conta como várias unidades de código UTF-16 na propriedade length de string do JavaScript. O contador conta os caracteres visíveis conforme aparecem no texto.
Por que a contagem de linhas é diferente da contagem de parágrafos?
As linhas são separadas por quebras de linha simples (um Enter). Os parágrafos são separados por linhas em branco (Enter duas vezes). Editores de texto geralmente contam parágrafos; editores de código contam linhas. A página mostra os dois para você escolher o que precisa.
Ele conta caracteres em URLs e em código?
Sim — tudo o que não é espaço em branco é contado. Se você só quer contar texto corrido (excluindo URLs, blocos de código, citações), remova-os manualmente antes de colar. Algumas páginas têm um modo 'Markdown-aware' que ignora os caracteres de sintaxe.
Meu texto é enviado para o servidor?
Não. A contagem acontece no seu navegador. O texto colado não é transmitido.