¿Cómo puede un estudiante de secundaria iniciarse en la visión por computadora?

  1. Matemáticas, Matemáticas, Matemáticas! Para hacer cualquier cosa en este campo, necesitarás una base sólida en matemáticas. Te animo a que aprendas matemáticas hasta el primer año de ingeniería. Pase tiempo en forma de matemáticas que impliquen transformaciones, álgebra matricial, teorías de conjuntos, etc.
  2. Su siguiente parada es el procesamiento de imágenes (IP). Comience a escribir programas que transformen imágenes, apliquen filtros, etc. Ejemplo de conversión de una imagen de 256 bits a una imagen de 1 bit
  3. Ahora comience a escribir programas que intentarán detectar formas 2D simples en una imagen. Para empezar, aplicará algunos algoritmos de reducción de ruido, luego realizará una detección de bordes o ajuste de contraste para poner formas interesantes al frente, luego cortará esas áreas interesantes y las comparará con formas conocidas, como digamos cuadrados de varias dimensiones. Este será tu primer CV hola mundo!
  4. Desde aquí, continúa expandiendo tus algoritmos para detectar varias formas 2D. El lote # 1 junto con la literatura en el campo del “análisis de imágenes” (que usa el lote # 1 :)) será útil
  5. Una vez que haya terminado con las formas 2d, continúe con el dominio complejo de formas 3d y formas desiguales
  6. Lo siguiente que debe hacer es detectar superposiciones, objetos ocultos en parte, oclusiones, ilusión de formas imposibles, campo de profundidad, sombras, rasgos faciales, etc.

¡Buena suerte!

Las matemáticas son ciertamente extremadamente importantes, como lo es la física. Pase su tiempo libre leyendo sobre algoritmos genéticos, redes neuronales y geometría analítica básica. Coge algunos libros de texto de ingeniería de primer año de una tienda de segunda mano y haz tu mejor esfuerzo. Implementar los algoritmos y fórmulas que aprendes en un lenguaje como c ++ te llevará por un largo camino.

Mientras haces esto, siéntete libre de aprender algo del lado práctico de la visión de computadora sin necesidad de aprender el meollo de la vida jugando con nuestra API en la nube, MonocularAPI | Jemsoft. Es gratis en pequeños volúmenes, y nuestros documentos y boletines desglosan algunos de los algoritmos y enfoques muy bien.

¡Buena suerte y diviertete!