O VAR se divide em duas partes principais: a estrutura de campo e a central de controle.
A estrutura de campo aproveita todas as câmeras tradicionais já usadas na transmissão do jogo e ainda conta com câmeras exclusivas para o sistema. No total, são 42 (oito são capazes de gerar imagens em super câmera lenta e quatro conseguem em ultra-câmera lenta).
Essas imagens são enviadas em tempo real, via fibra ótica, à central de controle - que, na Copa do Mundo do Catar ficará localizada em Doha, capital do país. É uma sala com diversos monitores e uma equipe de pessoas com funções distintas.
Tudo começa com um grupo de três operadores de replay, que assistem ao lance polêmico e selecionam os melhores ângulos para analisá-lo.
Um árbitro-assistente confere a jogada em duas telas e é o responsável por fazer a comunicação entre a equipe do VAR e o árbitro de campo, por meio de um sistema de rádio sobre fibra, também de alta velocidade.
Há ainda mais três auxiliares com funções distintas. O primeiro se concentra na imagem principal da transmissão para checar se há algum incidente. O segundo fica responsável por detectar possíveis lances de impedimento. E o terceiro fica de olho na transmissão da TV e cuida da comunicação entre o responsável por detectar lances de impedimento e o árbitro assistente por vídeo principal.
Sempre que há algum lance polêmico que conta com a participação do VAR, o árbitro do jogo tem acesso às imagens selecionadas pela central de controle por meio de um monitor à beira do campo. A partir disso e das sugestões enviadas pela equipe de vídeo, o árbitro toma a decisão sobre o lance.