std::regex_token_iterator

De cppreference.com

Definido en el archivo de encabezado `<regex>`
template< class BidirIt, class CharT = typename std::iterator_traits<BidirIt>::value_type, class Traits = std::regex_traits<CharT> > class regex_token_iterator		(desde C++11)

std::regex_token_iterator es un ForwardIterator de solo lectura que accede a las subcoincidencias individuales de cada coincidencia de una expresión regular dentro de la secuencia de caracteres subyacentes. También se puede usar para acceder a las partes de la secuencia que no se coincidieron por una expresión regular dada (p. ej., como un tokenizador).

Durante la construcción, construye un std::regex_iterator y en cada incremento pasa a través de las subcoincidencias solicitadas del objeto std::match_results actual, incrementando el regex_iterator subyacente cuando la incrementación se aleja de la última subcoincidencia.

El iterador std::regex_token_iterator construido por defecto es el iterador al final de la secuencia. Cuando un iterador std::regex_token_iterator válido se incrementa después de alcanzar la última subcoincidencia de la última coincidencia, se hace igual al iterador al final de la secuencia. Desreferenciarlo o incrementarlo más allá resulta en comportamiento no definido.

Justo antes de volverse el iterador al final de la secuencia, un std::regex_token_iterator puede volverse un iterador de sufijo, si el índice -1 (un fragmento no coincidido) aparece en la lista de los índices de la subcoincidencia solicitada. Dicho iterador, si se desreferencia, devuelve un objeto std::match_results correspondiente a la secuencia de caracteres entre la última coincidencia y el final de la secuencia.

Una implementación habitual de std::regex_token_iterator alberga el iterador std::regex_iterator subyacente, un contenedor (p. ej., std::vector<int>) de los índices de la subcoincidencia solicitada, el contador interno igual al índice de la subcoincidencia, un puntero a std::sub_match, que apunta a la subcoincidencia actual de la coincidencia actual, y un objeto std::match_results que contiene la última secuencia de caracteres que no coincidieron (usados en la modalidad tokenizador).

Contenido

[editar] Requerimientos de tipo

BidirIt debe satisfacer los requisitos de BidirectionalIterator.

[editar] Especializaciones

Se definen varias especializaciones para los tipos de secuencias de caracteres comunes:

Definido en el archivo de encabezado `<regex>`
Tipo	Definición
`cregex_token_iterator`	regex_token_iterator<const char*>
`wcregex_token_iterator`	regex_token_iterator<const wchar_t*>
`sregex_token_iterator`	regex_token_iterator<std::string::const_iterator>
`wsregex_token_iterator`	regex_token_iterator<std::wstring::const_iterator>

[editar] Tipos miembro

Tipo miembro	Definición
`value_type`	std::sub_match<BidirIt>
`difference_type`	std::ptrdiff_t
`pointer`	const value_type*
`reference`	const value_type&
`iterator_category`	std::forward_iterator_tag
`regex_type`	basic_regex<CharT, Traits>

[editar] Funciones miembro

(constructor)	Construye un nuevo objeto `regex_token_iterator`. (función miembro pública) [editar]
(destructor) (implícitamente declarado)	Destruye un objeto `regex_token_iterator`, incluyendo el valor almacenado en caché. (función miembro pública) [editar]
operator=	Asigna el contenido. (función miembro pública) [editar]
operator==operator!= (eliminado en C++20)	Compara dos objetos `regex_token_iterator`. (función miembro pública) [editar]
operator*operator->	Accede a la subcoincidencia actual. (función miembro pública) [editar]
operator++operator++(int)	Avanza el iterador a la subcoincidencia siguiente. (función miembro pública) [editar]

[editar] Notas

La responsabilidad del programador es asegurar que el objeto std::basic_regex pasado al constructor del iterador sobreviva al iterador. Debido a que el iterador almacena un std::regex_iterator, que almacena un puntero a la expresión regular, incrementar el iterador después de que se destruyó la expresión regular resulta en comportamiento no definido.

[editar] Ejemplo

Ejecuta este código

#include <fstream>
#include <iostream>
#include <algorithm>
#include <iterator>
#include <regex>
 
int main()
{
    // Tokenización (fragmentos que no coincidieron)
    // Observa que la expresión regular se coincide solo dos veces;
    // cuando el tercer valor se obtiene, el iterador es un iterador de sufijo.
    const std::string texto = "La zorra veloz.";
    const std::regex er_espacio("\\s+"); // espacio en blanco
    std::copy( std::sregex_token_iterator(texto.begin(), texto.end(), er_espacio, -1),
               std::sregex_token_iterator(),
               std::ostream_iterator<std::string>(std::cout, "\n"));
 
    std::cout << '\n';
 
    // Iterar sobre las primeras subcoincidencias
    const std::string html = R"(<p><a href="http://google.com.mx">google</a> )"
                             R"(< a HREF ="http://es.cppreference.com">cppreference</a>\n</p>)";
    const std::regex er_url(R"!!(<\s*A\s+[^>]*href\s*=\s*"([^"]*)")!!", std::regex::icase);
    std::copy( std::sregex_token_iterator(html.begin(), html.end(), er_url, 1),
               std::sregex_token_iterator(),
               std::ostream_iterator<std::string>(std::cout, "\n"));
}

Salida:

La
zorra
veloz.
 
http://google.com.mx
http://es.cppreference.com

Obtenido de «https://es.cppreference.com/mwiki/index.php?title=cpp/regex/regex_token_iterator&oldid=40599»

Apoyo de compiladores
Implementaciones independientes y albergadas
Lenguaje
Biblioteca estándar
Encabezados de la biblioteca estándar
Requisitos denominados
Macros de prueba de característica (C++20)
Biblioteca de apoyo del lenguaje
Biblioteca de conceptos (C++20)
Biblioteca de diagnósticos
Biblioteca de gestión de memoria
Biblioteca de metaprogramación (C++11)
Biblioteca de servicios generales
Biblioteca de contenedores
Biblioteca de iteradores
Biblioteca de rangos (C++20)
Biblioteca de algoritmos
Biblioteca de cadenas
Biblioteca de procesamiento de texto
Biblioteca numérica
Biblioteca de fecha y hora
Biblioteca de entrada/salida
Biblioteca del sistema de archivos (C++17)
Biblioteca de apoyo de concurrencia (C++11)
Biblioteca de apoyo de ejecución (C++26)
Especificaciones técnicas
Índice de símbolos
Bibliotecas externas

Clases
basic_regex (C++11)
sub_match (C++11)
match_results (C++11)
Algoritmos
regex_match (C++11)
regex_search (C++11)
regex_replace (C++11)
Iteradores
regex_iterator (C++11)
regex_token_iterator (C++11)
Excepciones
regex_error (C++11)
Rasgos
regex_traits (C++11)
Constantes
syntax_option_type (C++11)
match_flag_type (C++11)
error_type (C++11)
Gramática de las expresiones regulares
ECMAScript-262 modificado (C++11)

Funciones miembro
regex_token_iterator::regex_token_iterator
regex_token_iterator::operator=
Comparaciones
regex_token_iterator::operator==regex_token_iterator::operator!= (hasta C++20)
Observadores
regex_token_iterator::operator*regex_token_iterator::operator->
Modificadores
regex_token_iterator::operator++regex_token_iterator::operator++(int)

cppreference.com

Espacios de nombres

Variantes

Vistas

Acciones