ToolActToolAct

글자 수 세기 도구

텍스트의 문자 수, 단어 수, 줄 수, 문단 수 등을 실시간으로 계산

텍스트 입력

기본 통계

총 문자 수0
문자 (공백 제외)0
한글 수0
영어 단어 수0
숫자 개수0

구조 통계

줄 수0
문단 수0
문장 수0

읽기 예상

예상 읽기 시간
1초
예상 읽어주기 시간
1초

통계 옵션

글자 수 세기란?

글자 수 세기 도구는 텍스트의 다양한 통계를 실시간으로 계산합니다. 문자 수, 단어 수, 줄 수 등을 포함합니다. 글쓰기, 논문, 코드 주석, 소셜 미디어 콘텐츠 등 어떤 경우든 텍스트의 기본 정보를 빠르게 파악하는 데 도움이 됩니다. 이 도구는 한글과 영어 혼합 통계를 지원하며, 한글 문자와 영어 단어를 지능적으로 식별하여 각각 계산합니다. 또한 읽기 시간 예상을 제공하여 독자가 콘텐츠를 읽는 데 얼마나 걸리는지 파악할 수 있습니다.

사용 방법

기본 조작

  1. 왼쪽 텍스트 상자에 텍스트를 입력하거나 붙여넣으세요
  2. 오른쪽 패널에서 통계가 실시간으로 업데이트됩니다
  3. 필요에 따라 옵션을 조정하세요 (구두점, 줄 바꿈 등)
  4. 언제든지 텍스트를 지우거나 붙여넣거나 복사하세요

계수 규칙

  • 총 문자 수: 공백, 구두점, 줄 바꿈을 포함한 모든 문자
  • 중국어 문자: 모든 중국어(CJK) 문자를 계산합니다
  • 영어 단어: 문자로 구성된 단어를 계산합니다
  • 단락: 빈 줄로 구분된 비어 있지 않은 텍스트 블록
  • 읽기 속도: 중국어 350자/분, 영어 225단어/분

활용 사례

에디터를 떠나지 않고 한영 혼합 문안 측정이중 언어 텍스트를 붙여넣으면 총 문자 수, 공백 제외 문자 수, 한글 수, 영어 단어 수, 숫자, 줄 수, 문단 수, 문장 수, 읽기·말하기 예상 시간이 실시간으로 업데이트됩니다. 제품 문안, 자막, 소셜 포스트, 지원 매크로처럼 서로 다른 언어의 계수 방식이 다른 경우에 유용합니다. 텍스트는 로컬 브라우저에서 처리되므로 카운터 실행 중 초안이 기기를 벗어나지 않습니다.
게시 및 인터페이스 한도에 맞게 콘텐츠 다듬기메타 설명, 버튼 라벨, 폼 힌트, 릴리스 노트, 앱 스토어 텍스트를 다듬으면서 카운트를 활용하세요. 지우기, 붙여넣기, 복사 컨트롤로 빠른 편집이 가능하고, 줄 바꿈 옵션은 대상 시스템이 줄 바꿈을 문자 예산의 일부로 처리할 때 도움이 됩니다.
녹화나 발표 전 나레이션 길이 추정스크립트, 강좌 노트, 데모 워크스루, 짧은 연설의 경우 읽기와 말하기 예상이 녹화 세션 전에 빠른 타이밍 점검을 제공합니다. 줄 수와 문단 수는 붙여넣은 텍스트에서 의도한 구조가 손실된 경우도 드러냅니다.
엄격한 양식 제출 전 계수 규칙 비교공백 포함/제외 문자 수, 하이픈 구문을 하나의 단어로 볼지 여러 단어로 볼지를 전환하여 대상 포털의 정책에 맞추세요. 일부 시험과 비자 시스템은 자체 토크나이저를 적용하므로 페이지 수치를 보증이 아닌 작업 추정치로 취급하세요. 읽기 시간 기본값은 영어 산문 분당 약 225단어, 한글 분당 약 350자를 가정하여 일반 성인 독자에 맞추지만, CJK 문자는 단어가 아니므로 전환 없이는 두 척도를 직접 비교할 수 없습니다.
페이지 론칭 시 SEO 메타데이터 필드 감사페이지 제목, 메타 설명, 슬러그, Open Graph 문안을 넣으면 모든 한도를 한꺼번에 확인할 수 있습니다. 제목 60자 근처, 설명 155자 근처, OG 필드 90자 근처. 최종 카운트를 내보내거나 스크린샷하면 론칭 후 SEO 체크리스트를 위한 기록이 됩니다. 문단 수는 빈 줄을 쉽게 드러냅니다. 도구는 블록에 비공백 텍스트가 있을 때만 문단 수를 증가시키므로, 연속 빈 줄 두 개는 문단 나누기 하나로 기록되지 둘로 기록되지 않습니다.

기술 원리

단어 수 세기는 유니코드 공백 문자를 기준으로 분할합니다. 라틴 문자의 경우 `text.trim().split(/\s+/).filter(Boolean)`에 가까운 정규식을 사용하며, ASCII 공백, 탭, 줄 바꿈, U+00A0(줄 바꿈 없는 공백) 및 U+2028(줄 구분자) 같은 유니코드 구분자와 일치합니다. 이 규칙은 영어, 프랑스어, 독일어 등 공백으로 분리되는 언어에 적합하지만, 단어 사이에 공백이 없는 중국어, 일본어, 태국어에서는 적용되지 않습니다. 따라서 CJK 텍스트는 `text.length`가 아닌 `[...text].length`로 문자 단위로 계산합니다. 전개 연산자는 유니코드 코드 포인트를 순회하여 U+FFF 이상의 문자(예: U+20000부터 시작하는 CJK 통합 한자 확장 B, U+1F300 이상의 대부분의 이모지)에 대한 서러게이트 쌍을 올바르게 처리합니다. CJK 문자 클래스 자체는 중국어 한자에 대해 유니코드 프로퍼티 이스케이프 `/\p{Script=han}/u`로 감지합니다. 자바스크립트 문자열의 `length` 프로퍼티는 유니코드 코드 포인트가 아닌 UTF-16 코드 유닛을 계수하므로, `'👨‍👩‍👧'.length === 8`이지만 시각적으로 보이는 글리프는 세 개의 이모지가 U+200D 폭폭 없는 결합기로 결합된 하나의 그래피즘 클러스터입니다. 정확한 계수에는 2023년 이후 모든 최신 브라우저에서 사용 가능한 `Intl.Segmenter('en', { granularity: 'grapheme' })`를 사용합니다. CJK를 포함한 모든 언어의 단어 수준 분할에는 `Intl.Segmenter(locale, { granularity: 'word' })`가 유니코드 표준 부록 #29를 따르며 사용 가능할 때 가장 정확한 옵션입니다. 문장 경계는 `[.!?…。!?]+` 뒤에 공백이나 문자열 끝이 오는 패턴으로 감지하며, 문단은 두 개 이상의 연속된 줄 바꿈(`\n\s*\n`)으로 감지합니다. 읽기 및 발화 시간 추정치는 공개된 읽기 속도 상수를 적용합니다. Brysbaert(2019) 메타 분석에 따르면 성인의 영어 논픽션 묵독 속도는 분당 238단어이며, 이것이 UI 기본값이 225~250 wpm인 이유입니다. 중국어 묵독 속도는 분당 350~500자입니다. 발화 속도는 더 느립니다: TED 강연 평균은 163 wpm이며, 오디오북 나레이션은 150~160 wpm을 목표로 합니다. 트위터의 280자 제한은 `twitter-text` 라이브러리를 통해 CJK와 대부분의 이모지를 가중치 2자로 계수하며, 지역 표시기 쌍(국기 이모지)은 원시 `.length`에서 UTF-16 코드 유닛 4개로 계수됩니다.

  • 공백 기준 단어 분할: `text.trim().split(/\s+/).filter(Boolean)`은 라틴 문자에 유효하지만, 단어 간 공백이 없는 CJK와 태국어에서는 실패합니다.
  • CJK 문자 계수는 `[...text].length`를 사용하여 유니코드 코드 포인트를 올바르게 순회합니다(U+FFF 이상의 서러게이트 쌍, 예: 확장 한자 및 이모지 처리).
  • `string.length`는 그래피즘이 아닌 UTF-16 코드 유닛을 반환합니다: 👨‍👩‍👧 가족 이모지는 `.length === 8`이지만 시각적으로 하나의 문자입니다.
  • 가장 정확한 분할: `Intl.Segmenter(locale, { granularity: 'word' | 'grapheme' })`는 유니코드 표준 부록 #29를 구현합니다.
  • 읽기 속도 기본값: 영어 묵독 225~250 wpm(Brysbaert 2019), 중국어 분당 350~500자; 나레이션 발화 150~160 wpm, TED 평균 163 wpm.
  • 문장 분할: `[.!?…。!?]+\s+`; 문단 분할: `\n\s*\n`; 줄 수: `text.split('\n').length`.
  • 트위터는 `twitter-text`를 통해 CJK와 대부분의 이모지를 280자 제한에 대해 가중치 2자로 계수합니다; 국기 이모지(지역 표시기 쌍)는 원시 UTF-16에서 `.length === 4`입니다.

예시

짧은 영문 문장

입력:  Hello world, this is a test.

전체 문자 수:        28
문자 수 (공백 제외):  23
단어:                   6
문장:                   1
읽는 시간:              ~2초 (225 wpm)

한·영 혼합 텍스트

입력:  Hello 你好世界, this is ToolAct.

전체 문자 수:    28
중국어 문자:      4   (你好世界)
영어 단어:        4   (Hello, this, is, ToolAct)
숫자:             0

280자 제한 내의 트위터 게시물

초안:  Launching a new browser-only toolbox today — 112 dev tools,
        zero uploads, zero tracking. Check it out at toolact.com.

전체 문자 수: 124  (트위터 280자 제한 내)
단어:         22
줄 수:        2

5분 분량 연설 시간 추정

원고:  영문 약 750 단어

읽는 시간:    3분 20초 (225 wpm 묵독)
발표 시간:    5분 0초  (150 wpm 발표 속도)
문단:         5  |  문장: 42

SEO 메타 설명 길이 확인

Title:        "ToolAct - 112 Online Developer Tools, Free and Private"
              -> 56 글자 (Google 표시 약 60)

Description:  "Format JSON, convert timestamps, generate cron expressions,
               and run 100+ more dev tools right in your browser. No uploads."
              -> 148 글자 (Google 표시 약 155)

자주 묻는 질문

이 카운터는 무엇을 측정하나요?

전체 글자 수, 공백 제외 글자 수, 한자(중국어 문자), 영어 단어, 숫자, 줄, 단락, 문장, 그리고 예상 읽기/말하기 시간을 측정합니다. 입력하거나 붙여넣는 즉시 실시간으로 갱신됩니다.

'단어'는 어떻게 정의되나요?

영어 단어는 공백으로 구분된 알파벳 문자열을 기준으로 셉니다. 한자는 CJK 유니코드 범위로 감지해 글자 단위로 셉니다. 숫자와 기호는 전체 글자 수에 포함됩니다.

읽기 시간은 어떻게 계산되나요?

기본값은 분당 200~250 단어로 성인의 평균 묵독 속도입니다. 말하기 속도는 더 느리고(약 150 wpm), 훑어 읽기는 더 빠릅니다(300~400 wpm). 표시되는 값은 대략적인 추정치이며 실제 시간은 내용 밀도와 독자의 숙련도에 따라 달라집니다.

이모지와 특수 문자도 카운트되나요?

네, 다만 😀 같은 이모지는 자바스크립트의 문자열 length 기준으로 여러 UTF-16 코드 단위에 해당한다는 점을 알아두세요. 카운터는 텍스트에 보이는 그대로의 문자를 셉니다.

줄 수와 단락 수가 다른 이유는 무엇인가요?

줄은 한 번 Enter로 구분된 한 행을, 단락은 두 번 Enter(빈 줄)로 구분된 덩어리를 가리킵니다. 워드 프로세서는 보통 단락을 세고, 코드 에디터는 줄을 셉니다. 본 페이지는 두 값을 모두 표시하므로 필요한 쪽을 선택하면 됩니다.

URL과 코드 안의 글자도 셈에 포함되나요?

네, 공백이 아닌 모든 문자는 카운트됩니다. 본문(URL, 코드 블록, 인용 등 제외)만 세고 싶다면 붙여넣기 전에 직접 제거하세요. 일부 페이지에는 마크다운 문법 문자를 무시하는 'Markdown 인식' 모드가 있습니다.

내 텍스트가 업로드되나요?

아니요. 카운트는 브라우저에서 처리됩니다. 붙여넣은 텍스트는 외부로 전송되지 않습니다.