Skip to content

Log Format pt BR

Rafael JPD edited this page Jan 12, 2025 · 1 revision

Formato esperado do conteúdo nos arquivos de log

Uma série de formatos de linha são suportados. É importante que cada linha contenha o IP real (IPv4 ou IPv6) da URL acessada, o dia e hora de cada acesso, o método HTTP de acesso (GET), o código de status do acesso (200, 204, 301, entre outros), a URL acessada e o agente de usuário utilizado para obter o conteúdo (por exemplo, navegador em dispositivo móvel). Outras informações como tamanho do conteúdo e tempo de resposta também podem compor o log.

É extremamente importante que o IP fornecido em cada linha de log seja o real, pois essa informação é usada para determinar uma sessão de usuário, conceito que é usado nos passos seguintes da calculadora de acessos para remoção de cliques duplos e outros ruídos que aumentam de maneira artificial os resultados. Caso o IP fornecido seja local (127.0.0.1, 168.0.0.1, 17.0.0.1, 10.0.0.1, entre outros) ou esteja ausente, a linha é descartada, pois não permite a definição de uma sessão de usuário - isso invialibiza a contegem de acessos nos moldes do Project COUNTER R5.

Caso o acesso seja feito por um agente de usuário que não seja um navegador web, como um robô ou um crawler, a linha também é descartada. As URLs que representam arquivos estáticos (por exemplo, imagens, folhas de estilo, entre outros) também são descartadas. A seguir, são elencados alguns exemplos de linhas de log válidas, isto é, que representam acessos às páginas de artigos em formato de resumo ou completo:

  1. scielo.isciii.es 117.64.147.191 - - [12/Feb/2024:04:23:09 +0100] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 18575 "-" "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36" 90571 364 18950
  2. 45.65.189.47 45.65.189.47, 198.41.230.129 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
  3. 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:12 0300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
  4. 186.130.151.215 186.130.151.215 172.69.138.111 [10/Dec/2024:00:00:120300] "GET /scielo.php?pid=S0718-07642017000400014&script=sci_arttext HTTP/1.1" 304 166 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36"
  5. 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"
  6. 45.65.189.47 - [06/Oct/2024:00:00:16 -0300] "GET /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract HTTP/1.1" 200 166 "https://www.scielo.cl/scielo.php?pid=S0718-50732020000300308&script=sci_arttext&tlng=pt" "Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15"

A tabela seguinte elenca os campos esperados/detectados em cada linha de log destacada na lista anterior:

IP Método HTTP Código HTTP URL Agente de Usuário
117.64.147.191 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3432.118 Safari/537.36
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15
186.130.151.215 GET 304 /scielo.php?pid=S0718-07642017000400014&script=sci_arttext Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36
186.130.151.215 GET 304 /scielo.php?pid=S0718-07642017000400014&script=sci_arttext Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15
45.65.189.47 GET 200 /scielo.php?lng=es&nrm=i&pid=S0213-91112023000100500&script=sci_abstract Mozilla/5 .0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/17.5 Safari/605.1.15

Clone this wiki locally