Generative A.I. + Law - Background, Applications and Use Cases Including GPT-4 Passes the Bar Exam

G E N E R AT I V E A
. I . + L AW @ computational professor daniel martin katz danielmartinkatz.com Illinois tech - chicago kent law 273Ventures.com B AC KG R O U N D, A P P L I CAT I O N S A N D U S E CA S E S I N C LU D I N G G P T- 4 PA S S E S T H E B A R E X A M https://bit.ly/3yxhY2e

NOVEMBER 30, 2022

I THINK THIS DAY WILL GO DOWN AS A VERY
IMPORTANT DAY IN THE HISTORY OF TECHNOLOGY

NOVEMBER 30, 2022 IS THE DAY THAT CHATGPT WAS FIRST
RELEASED BECAUSE

THIS WAS THE BEGINNING OF THE BROADER PUBLIC’S AWARENESS …

OF WHAT WAS ALREADY TRUE …

WHICH IS THAT IN THE BACKGROUND

THERE HAVE BEEN FUNDAMENTAL IMPROVEMENTS OCCURING WITHIN THE WORLD OF
NATURAL LANGUAGE PROCESSING (NLP)

I PERSONALLY HAVE BEEN WORKING IN THIS AREA FOR A
WHILE …

THINKING ABOUT HOW TO USE NLP MODELS IN THE LEGAL
DOMAIN

https://sites.google.com/view/nllp/nllp-2019

https://law.mit.edu/pub/openedgar/release/1

https://aclanthology.org/2022.acl-long.297.pdf

https://speakerdeck.com/danielkatz/legal-nlp-breaking-the-legal-language-barrier

BUT IT HAS BEEN HARD TO COMMUNICATE TO MANY FOLKS
IN THE LEGAL SECTOR …

ABOUT THE NATURE OF THE LANDSCAPE SHIFT IN THE FIELD
…

MAYBE IT IS ROBOLAWYER FATIUGE …?

MAYBE IT IS THE ABSENCE OF A CLEAR DEMONSTRATION PROJECT
…

SO NOW WE ARE JUST A FEW MONTHS INTO WHAT
IS ARGUABLY THE MOST SUCCESSFUL PRODUCT LAUNCH IN HISTORY …

TODAY — I WOULD LIKE TO DISCUSS WHAT ALL OF
THESE DEVELOPMENTS …

MIGHT MEAN FOR THE DELIVERY OF LEGAL SERVICES …

SO FOR MY OPENING STATEMENT PLEASE TAKE INTO ACCOUNT THE
FOLLOWING FOUR CONSIDERATIONS…

< CONSIDERATION 1 > LANGUAGE IS THE ‘COIN OF THE
REALM’ HERE IN THE WORLD OF LAW < CONSIDERATION 2 > THE MARCH OF LEGAL COMPLEXITY < CONSIDERATION 3 > MACHINES ARE INCREASINGLY IMPROVING IN LANGUAGE PROCESSING < CONSIDERATION 4 > LEGAL LANGUAGE != REGULAR LANGUAGE ?

< CONSIDERATION 1 >

LANGUAGE IS THE ‘COIN OF THE REALM’ HERE IN THE
WORLD OF LAW

VIRTUALLY ALL ROADS IN LAW LEAD TO A DOCUMENT (CONSUMPTION,
PRODUCTION OR BOTH)

LAWYERS, JUDGES AND REGULATORS ARE MASSIVE PRODUCERS OF TEXT

BRIEFS, MEMOS, STATUTES, OPINIONS, REGULATIONS, CONTRACTS, ETC.

ARE JUST SOME OF THE LEGAL WORK PRODUCT …

PRODUCED ON A DAILY BASIS ACROSS THE WORLD’S VARIOUS LEGAL
SYSTEMS

NOT ONLY IS IT THE SHEER VOLUME OF TEXT BUT
ALSO THESE MASSIVE VOLUMES OF TEXT ARE NOTORIOUSLY COMPLEX

< CONSIDERATION 2 >

THE MARCH OF LEGAL COMPLEXITY

W H E T H E R YO U A
R E A L A R G E M U LT I N AT I O N A L CO R P O R AT I O N , A S M A L L B U S I N E S S O R A N I N D I V I D UA L C I T I Z E N …

L AW H A S A CO M P L
E X I TY C H A L L E N G E …

IF YOU TAKE A STEP BACK

AND LOOK AT THE UNIT ECONOMICS OF LAW

THE REAL ANIMATING DRIVER IN THE DEMAND FOR UNITS OF
LEGAL PRODUCTION

IS COMPLEXITY

SOCIAL, ECONOMIC AND POLITICAL COMPLEXITY

MANIFESTS ITSELF IN OUR DOMAIN AS LEGAL COMPLEXITY

WHILE IT IS SOMEWHAT HARD TO PRECISELY DEFINE …

VIRTUALLY EVERY WAY YOU MIGHT CONSIDER IT LEGAL COMPLEXITY HAS
GROWN

DANIEL MARTIN KATZ, CORINNA COUPETTE, JANIS BECKEDORF & DIRK HARTUNG,
COMPLEX SOCIETIES AND THE GROWTH OF THE LAW, 10 SCIENTIFIC REPORTS 18737 (2020) CORINNA COUPETTE, JANIS BECKEDORF, DIRK HARTUNG, MICHAEL BOMMARITO, & DANIEL MARTIN KATZ, MEASURING LAW OVER TIME: A NETWORK ANALYTICAL FRAMEWORK WITH AN APPLICATION TO STATUTES AND REGULATIONS IN THE UNITED STATES AND GERMANY, FRONT. PHYS. (2021 FORTHCOMING)

SIGNIFICANT GROWTH IN LAWS AND REGULATIONS

KEY TAKE AWAY - OVER PAST TWO DECADES ~50%+ MORE
STATUTES ~200% MORE REGULATIONS

SO THE QUESTION IS HOW TO MATCH THAT COMPLEXITY WITH
THE APPROPRIATE

COMPLEXITY MITIGATION TACTICS …

MIXTURE OF PEOPLE, PROCESS AND TECHNOLOGY

DESIGNING MORE SCALABLE SYSTEMS

http://prawfsblawg.blogs.com/prawfsblawg/2017/03/-complexity-mitigation-strategies- for-law-law-land-and-beyond-and-some-other-thoughts-on-had fi eld-su.html#more SOME THOUGHTS ON LEGAL COMPLEXITY MITIGATION
STRATEGIES

< CONSIDERATION 3 >

MACHINES ARE INCREASINGLY IMPROVING IN THEIR ABILITY TO PROCESS AND
‘UNDERSTAND’ LANGUAGE

INITIAL PERFORMANCE AND HUMAN PERFORMANCE ARE NORMALIZED TO -1 AND
0 RESPECTIVELY (KIELA ET AL., 2021).

AND LEADING MODELS ARE RAPIDLY GROWING IN SCALE

SIZE OF LARGE LANGUAGE MODELS IN BILLIONS OF PARAMETERS

THE IMPLICATION IS THAT PREVIOUSLY UNTOUCHABLE PROBLEMS WILL BEGIN TO
COME WITHIN REACH …

BECAUSE COMPLEXITY IS ARGUABLY SCALING FASTER THAN AVAILABLE RESOURCES …

WE ARGUABLY NEED A FORCE MULTIPLIER …

AND LANGUAGE IS CORE TO MOST (ALL) LEGAL TASKS

THE FACT THAT LANGUAGE TECHNOLOGY HAS BEEN MATERIALLY IMPROVING MIGHT
BODE VERY WELL …

AS THE FORCE MULTIPLIER, PRODUCTIVITY ENHANCER …

THE FIELD ARGUABLY NEEDS …

TO SUPPORT THE QUANTITY, QUALITY, AND ACCESSIBILITY OF LEGAL SERVICES
DEMANDED BY SOCIETY

< CONSIDERATION 4 >

SO WHAT ABOUT LEGAL LANGUAGE ?

LETS BE CLEAR — FOR AI / NLP TO MAKE
A DEEP INCURSION INTO THIS FIELD …

IT NEEDS TO BE ABLE TO MORE FUNDAMENTALLY ENGAGE WITH
LANGUAGE

AND NOT JUST ANY LANGUAGE …

BUT LEGAL LANGUAGE

THE PUBLIC HAS A DIM VIEW OF LEGAL LANGUAGE …

THEY DESCRIBE LEGAL DOCUMENTS AND ARGUMENTS USING TERMS SUCH AS
‘LEGALESE’ ‘LEGAL JARGON’ ‘LEGAL GOBBLEDYGOOK’

LEGAL ENGLISH != ENGLISH (AND THIS IS TRUE FOR MANY
OTHER LANGUAGES)

INDEED MANY LAW STUDENTS CONSIDER THEIR INITIAL FORAY INTO THE
FIELD …

AS AN EXERCISE IN ‘LEARNING A NEW LANGUAGE’

IN SUPPORT OF THIS TASK …

LAW FEATURES SPECIALIZED DICTIONARIES

TEXT BASED SUMMARIES

AND MANY OTHER RESOURCES DESIGNED TO SUPPORT …

THE DEVELOPMENT OF THE LINGUISTIC IMMERSION PROGRAM THAT WE CALL
#LEGALEDUCATION

NLP MODELS HAVE BEEN DEPLOYED IN THE LEGAL SECTOR …

BUT THE QUALITY AND PERFORMANCE HAS BEEN MIXED …

FRANKLY *NO* LEGAL TECH SOLUTION BUILT TO DATE HAS BEEN
ABLE TO REALLY WORK WELL WITH NUANCES OF LEGAL LANGUAGE …

BUT THAT MIGHT BE ABOUT TO CHANGE …

TODAY I WILL DIVIDE THE REMAINING PRESENTATION INTO FIVE PARTS

(1) THE (LONG) PATH TO GENERATIVE A.I. (2) WHAT IS
GPT / CHATGPT / GPT-4 ? (3) BAR EXAM AS WINDOW INTO CAPABILITIES (4) LLMs IN THE DELIVERY OF LEGAL SERVICES (5) STRATEGIC CONSIDERATIONS AND THE ROAD AHEAD PRESENTATION IN FIVE PARTS

(1) THE (LONG) PATH TO GENERATIVE A.I.

IN ORDER TO UNDERSTAND WHERE THIS MIGHT ALL BE GOING
…

IT IS USEFUL TO UNDERSTAND THE ARC THAT HAS BROUGHT
US TO THIS MOMENT …

SO LETS GO BACK TO THE EARLY DAYS …

BUT BEFORE WE TALK ABOUT ANYTHING TOO FANCY …

I WOULD LIKE TO REMIND EVERYONE …

BEFORE THERE WERE COMPUTERS

HUMANS ARE THE ORIGINAL COMPUTERS

HUMANS ONCE DID ALL OF THE COMPUTING

OVER THE COURSE OF MANY YEARS WE WERE ABLE TO
LEVERAGE ALTERNATIVE FORMS OF COMPUTATION …

THE FIELD OF ARTIFICIAL INTELLIGENCE IS ROUGHLY 75 YEARS OLD
…

“BEFORE 1949, ‘COMPUTERS LACKED A KEY PREREQUISITE FOR INTELLIGENCE: THEY
COULDN’T STORE COMMANDS, ONLY EXECUTE THEM …” http://sitn.hms.harvard.edu/ fl ash/2017/history-arti fi cial-intelligence/

SO WHAT IS ‘ARTIFICIAL INTELLIGENCE’ ?

BIG IDEA IN AI IS TO DEVELOP IN MACHINES SOME
LEVEL OF SYNTHETIC (OR ARTIFICIAL) REPRESENTATION OF A PREVIOUSLY HUMAN CENTERED PROCESS

ARTIFICIAL INTELLIGENCE IS A BROAD FIELD

EVEN IN THE FOUNDATIONAL DAYS THERE WAS A VIEW ABOUT
THE ROLE OF A ‘CONVERSATIONAL AGENT’ AS A MEANS TO EVALUATE THE QUALITY OF AN AI SYSTEM

WHICH IS TO SAY THAT LANGUAGE HAS ALWAYS BEEN A
CORE TOPIC FOR THE FIELD OF A.I.

ALAN TURING IS ARGUABLY THE FATHER OF THE FIELD OF
COMPUTER SCIENCE

AND THIS IDEA OF CONVERSATIONAL AGENT COMES FROM HIM …

NOTE THE MOVIE WAS MOSTLY ABOUT CRACKING ENIGMA BUT HERE
IS WHERE IT GETS ITS TITLE THE TURING TEST

IT IS IMPORTANT TO REMEMBER WITH TOPICS SUCH AS ARTIFICIAL
INTELLIGENCE AND NATURAL LANGUAGE PROCESSING …

THE FIELD OF A.I. HAS HAD MANY FALSE STARTS AND
A.I. WINTERS

EVEN SOME OF THE WORLD’S LEADING EXPERTS HAVE GOTTEN THINGS
WRONG …

“MACHINES WILL BE CAPABLE, WITHIN TWENTY YEARS, OF DOING ANY
WORK THAT A MAN CAN DO.” – Herbert Simon in 1965

“MACHINES WILL BE CAPABLE, WITHIN TWENTY YEARS, OF DOING ANY
WORK THAT A MAN CAN DO.” – Herbert Simon in 1965 did not pan out by 1985 but did turn out okay for him …

SO I MENTION THIS ONLY SO THAT WE GROUND OURSELVES
A BIT …

A.I. BROADLY HAS MADE MAJOR PROGRESS ON MANY TOPICS …

MACHINE LEARNING

MACHINE LEARNING HAS BEEN USED TO UNDERTAKE VARIOUS FORMS OF
PREDICTION IN LAW

EXAMPLE LITIGATION PREDICTION

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0174698 Katz DM, Bommarito MJ II, Blackman J (2017), A
General Approach for Predicting the Behavior of the Supreme Court of the United States. PLoS ONE 12(4): e0174698.

http://www.sciencemag.org/news/ 2017/05/arti fi cial-intelligence-prevails- predicting-supreme-court-decisions Professor Katz noted that in
the long term … “We believe the blend of experts, crowds, and algorithms is the secret sauce for the whole thing.” May 2nd 2017

https://www.wsj.com/articles/hidden- in-plain-sight-a-powerful-way-to- beat-the-market-1497367597 FT Big Read Feb 7, 2019

http://arxiv.org/abs/1508.05751 available at http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2649726

LITIGATION FUNDING

“Lawyers say the real value in mediation and arbitration might
in the future come from large-scale data analysis of arbitrators and mediators themselves, in an effort to predict outcomes and potentially affect the course of settlements … Matthew Saunders, partner at Ashurst, notes that data analytics “could be extended to predicting which way arbitrators or a mediator might go”. Such technology may yet be some way off. In mediation, “a skilled facilitator helps the parties to explore where common ground can be found as the basis for an amicable settlement,” says James Freeman, arbitration partner at Allen & Overy. “The mediation process”, he adds, “is inherently a human one”.

DATA —> VARIABLES MODELS (STATISTICAL) OUTPUTS WITH VALIDATION

MUCH MORE COULD BE SAID ON THE LEGAL PREDICTION SIDE
OF THIS …

TODAY I AM MOSTLY GOING TO FOCUS ON GENERATIVE LANGUAGE
MODELS …

A.I. IS A VERY BROAD FIELD

AND OF COURSE THERE ARE OTHER GENERATIVE MODELS MY SON
AND I RECENTLY CREATED ‘BROCCOLI MAN’ GENERATIVE A.I. ART

HISTORICALLY LANGUAGE HAS ALWAYS LAGGED OTHER ADVANCES IN A.I. …

BECAUSE OF THE UNDERLYING STATISTICAL DEPENDENCIES - LANGUAGE IS A
*HARD* PROBLEM …

YET MAJOR ADVANCES ARE FINALLY COMING TO MARKET …

HISTORICALLY NLP (LIKE THE REST OF A.I.) WAS RULES-BASED

RULES-BASED A.I. WAS ACTUALLY THE ONLY OPTION AT ONE POINT

Moore’s law !

Kryder’s law !

EVENTUALLY COMPUTER CHIPS WERE FAST ENOUGH AND DATA STORAGE WAS
CHEAP ENOUGH …

THAT NLP COULD REALLY EMBRACE STATISTICAL MODELING …

NLP SLOWLY BECOMES A STATISTICAL FIELD IN THE 1990’S AND
2000’S

MARK LIBERMAN, "THE TREND TOWARDS STATISTICAL MODELS IN NATURAL LANGUAGE
PROCESSING." NATURAL LANGUAGE AND SPEECH: SYMPOSIUM PROCEEDINGS BRUSSELS, SPRINGER, (1991)

BUT THE PRIMARY EFFORT HERE WAS ON SYNTAX BASED APPROACHES
…

“There have been a series of clever approaches to backdoor
into semantics* … (*while also being scalable) Semantic Methods (Fairly Difficult) Syntax Methods (Fairly Easy) Historically, Big Divide between Semantics and Syntax Quasi-Semantic Methods

SYNTAX

WORDS WORD FREQUENCY PART OF SPEECH FREQUENCY ETC.

CTRL + F IS EXACT ‘STRING’ MATCHING

REGULAR EXPRESSION (REGEX) RULES-BASED METHOD(S) THAT CAN BE USED TO
LOOK FOR WORD PATTERNS AND RETURN RESULTS FOR THOSE PATTERNS

TF - IDF TERM FREQUENCY INVERSE DOCUMENT FREQUENCY EXPLOITS THE
FREQUENCY OF WORDS IN DOCUMENTS IN ORDER TO PROFILE THEM

SEMANTICS

SEMANTICS IS ABOUT THE MEANING OF INDIVIDUAL WORDS SEMANTICS IS
RELATIONSHIP BETWEEN WORDS THAT INTERACT TO PRODUCE HIGHER ORDER MEANING

LOTS OF THE TRAINING FOR LAWYERS IS ACTUALLY ABOUT THE
DEEP SEMANTIC INTERPRETATION OF LANGUAGE CONTRACTS STATUTES REGULATIONS JUDICIAL DECISIONS EXAMPLES —>

SEMANTICS IS HARD FOR MACHINES

BUT THE PAST DECADE THERE HAS BEGUN TO BE PROGRESS
ON THIS FRONT …

WE HAVE SEEN THE EMERGENCE OF QUASI-SEMANTIC METHODS

QUASI-SEMANTIC METHODS WHICH CAN INCREASINGLY TAKE CONTEXT INTO ACCOUNT

WHAT WE SEE TODAY ARE FOLKS USING DEEP NEURAL NETWORKS
TO WORK ON NLP PROBLEMS

GENERATIVE A.I. IN THE LINGUISTIC CONTEXT IS A MASH UP
OF DEEP LEARNING + NLP

CLASSIC VS NEURAL NLP

BTW WE SEE THIS SAME PROGRESSION IN LEGAL NLP AS
WELL …

HERE WE ANALYZE TRENDS WITHIN EVERY LEGAL NLP PAPER (MORE
THAN 600+ PAPERS) WRITTEN OVER THE PAST DECADE

GROWTH IN NUMBER OF PAPERS AND LANGUAGES

THE NEURAL AGENDA HAS COME TO LEGAL NLP

ALMOST NO TEXT GENERATION OR MACHINE SUMMARIZATION (BUT NOW THAT
IS VERY LIKELY TO CHANGE)

(2) WHAT IS GPT ? WHAT IS CHATGPT ? WHAT
IS GPT-4 ?

GPT = GENERATIVE PRE-TRAINED TRANSFORMER (WE CAN TRY TO UNPACK
ALL OF THIS IN A MINUTE)

GPT = IT IS A LARGE LANGUAGE MODEL (LLM) BUT
FAR FROM THE ONLY ONE GENERATIVE PRE-TRAINED TRANSFORMER

TODAY I WILL MOSTLY LIMIT MY COMMENTS TO GPT BUT
JUST WANTED TO FLAG THERE ARE OTHER MODELS OUT THERE

XAVIER AMATRIAIN, TRANSFORMER MODELS: AN INTRODUCTION AND CATALOG, ARXIV:2302.07730 (2023)
HTTPS://ARXIV.ORG/ABS/2302.07730 THE LEADING LLM MODELS

THE LEADING LLM MODELS XAVIER AMATRIAIN, TRANSFORMER MODELS: AN INTRODUCTION
AND CATALOG, ARXIV:2302.07730 (2023) HTTPS://ARXIV.ORG/ABS/2302.07730

THE OPEN AI GPT MODELS COMBINE SEVERAL IDEAS TOGETHER FROM
THE VARIOUS PAPERS IN THIS PROGRESSION …

Word2Vec (2013)

ELMO (2018)

BERT (2019)

BTW IT SHOULD BE NOTED THAT …

CHATGPT / GPT-3.5 / GPT-4 ARE PROPRIETARY MODELS SO WE
DO NOT KNOW FOR CERTAIN ALL OF THE DEEP DETAILS

WE WILL NOT GET INTO THE SUPER TECHNICAL DETAILS TODAY
…

FOR A VERY APPROACHABLE TREATMENT GO HERE https://writings.stephenwolfram.com/2023/02/ what-is-chatgpt-doing-and-why-does-it-work/

I MET STEPHEN WOLFRAM’S ROBOT PRESENCE IN HOUSTON IN 2011
HE APPEARED AT A COMPUTATIONAL LAW CONFERENCE VIA ROBOT (A REAL BOSS MOVE) STEPHEN AND YOURS TRULY TALKING ABOUT RULE 90 IT WAS A ‘BIG BANG’ MOMENT

BETTER HARDWARE PARALLEL COMPUTING ATTENTION MECHANISM THE PATH TO MEGASCALE
LARGE LANGUAGE MODELS HAS BEEN DRIVEN BY A MIXTURE OF

THE SAME TECH THAT HAS POWERED HIGHLY IMMERSIVE GAMING HAS
ALSO PUSHED SCIENCE FORWARD … https://www.thegamer.com/pc-games-best-intense-graphics/

APRIL 5, 2023 NOT COMPARED DIRECTLY WITH THE H100 BUT
THIS SHOWS YOU THE NATURE OF THE COMPETITION TAKING PLACE https://www.cnbc.com/2023/04/05/google- reveals-its-newest-ai-supercomputer- claims-it-beats-nvidia-.html

WOULD TAKE 300 YEARS TO TRAIN EVEN GPT-3 ON A
SINGLE GPU BUT WE TRANSFORMER ARCHITECTURE ALLOWS FOR SIGNIFICANT PARALLELIZATION

TRAINED MODEL ON A BILLION PAIRS OF WORDS IN JUST
3.5 DAYS ON EIGHT NVIDIA GPUS … THIS APPROACH HIGHLIGHTED A PATH TO THE PRESENT WITH EVER LARGER FUTURE https://blogs.nvidia.com/blog/2022/03/25/ what-is-a-transformer-model/

NOW PARALLEL COMPUTING IS BEING DONE ON A MEGASCALE

GPT-3 (RELEASED IN 2020) IS THIRD GENERATION OF THE GPT
FAMILY

FAMILY GPT-3.5 IS AN INTERMEDIATE IMPROVEMENT ON ORIGINAL GPT-3

FAMILY GPT-4 IS THE MOST RECENT RELEASE AND IT IS LIKELY TO BE A ‘FAMILY OF MODELS’ GPT-3.5 IS AN INTERMEDIATE IMPROVEMENT ON ORIGINAL GPT-3

JUST LIKE GPT-3.5 IS NOW A FAMILY OF MODELS

SOME INPUTS TO GPT COMMON CRAWL WEBTEXT2 BOOKS1/2 WIKIPEDIA OPENAI
LIKELY DID SOME SIGNIFICANT CLEANING / PREPROCESSING OF THESE SOURCES PRIOR TO TRAINING GPT-3 IS 175B PARAMETERS TRAINED WITH 499B TOKENS

TRANSFORMER ARCHITECTURE NEURAL NETWORK MODEL SCALE REINFORCEMENT LEARNING PRETRAINING JUST
SOME KEY TERMINOLOGY YOU SHOULD LEARN CONTEXT WINDOW ATTENTION MECHANISM MODEL TUNING GRADIENT DESCENT

TAKE ORIGINAL LLM GPT-3 https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent- Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1 CHATGPT IS AN OFFSHOOT
OF GPT-3

COMBINE SPECIFIC TRAINING ON INSTRUCTIONS TAKE ORIGINAL LLM GPT-3 https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent-
Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1 CHATGPT IS AN OFFSHOOT OF GPT-3

FURTHER TUNE ON INSTRUCTIONS COMBINE SPECIFIC TRAINING ON INSTRUCTIONS TAKE
ORIGINAL LLM GPT-3 https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent- Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1 CHATGPT IS AN OFFSHOOT OF GPT-3

FURTHER TUNE ON INSTRUCTIONS SUPPORT WITH SPECIFIC REINFORCEMENT LEARNING FEEDBACK
LOOP COMBINE SPECIFIC TRAINING ON INSTRUCTIONS TAKE ORIGINAL LLM GPT-3 https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent- Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1 CHATGPT IS AN OFFSHOOT OF GPT-3

THE GPT-4 TECHNICAL REPORT OFFERS SOME BUT NOT MOST OF
THE KEY DETAILS

RLHF WAS CLEARLY PART OF THE BREW HERE BUT GENERALLY
DOES NOT SEEM TO BE MOVING THE NEEDLE ALL THAT MUCH AT THIS POINT

SO THE POINT HERE IS TO MAKE CLEAR THAT THERE
ARE MANY STEPS AND MOVING PARTS …

THERE ARE OTHER PLAYERS BESIDES OPENAI AND THEY WILL LIKELY
PURSUE OTHER STEPS / MOVING PARTS … AND MANY MORE …

(3) BAR EXAM AS WINDOW INTO INCREASED CAPABILITIES

AGAIN WE HAD BEEN TRYING TO DISCUSS / HIGHLIGHT THE
INCREASING CAPABILITIES OF LANGUAGE MODELS FOR SOME TIME

WE THOUGHT THAT SOME SORT OF A PUBLIC DEMONSTRATION WOULD
HELP MAKE THE POINT …

REMEMBER THIS IS A TASK THAT MANY WOULD THINK IS
IMPOSSIBLE (LAST YEAR I WOULD HAVE SAID IT WOULD NOT OCCUR FOR MANY YEARS)

SOME TASKS LAWYERS REGULARLY UNDERTAKE ARE ACTUALLY WAY *EASIER* THAN
THE BAR EXAM (AND OTHERS ARE HARDER) LET’S BE CLEAR …

TO HAVE A CHANCE ON THE BAR EXAM …

EXAMINEE MUST POSSESS A THRESHOLD AMOUNT OF LEGAL KNOWLEDGE AND
READING COMPREHENSION SKILLS AND SEMANTIC AND SYNTACTIC COMMAND OF THE ENGLISH LANGUAGE

RIGHT BEFORE THE HOLIDAYS ROUGHLY DEC 22, 2022

I CALLED MY FRIEND AND FREQUENT COLLABORATOR MIKE BOMMARITO

AND SAID LET’S EVALUATE GPT-3.5 (TEXT-DAVINCI-003) ON THE MULTIPLE CHOICE
PART OF THE BAR EXAM

AND IT DID PRETTY WELL …

V1.01 - December 29, 2022 V2.01 - January 3, 2023

LITTLE DID WE KNOW AT THE TIME THAT THIS PAPER
PUT US ON A PATH …

TO BE INVOLVED IN THE LAUNCH OF GPT-4* *OBVIOUSLY WE
ARE JUST PLAYING A VERY SMALL ROLE IN THE BIG PICTURE (BUT WE WILL TAKE IT!)

GPT-4 BAR EXAM https://openai.com/research/gpt-4 March 14, 2023

CHATGPT BAR EXAM PASSES Paper Now Available on SSRN! March
15, 2023 - Version 1.01 https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4389233

https://www.law.com/legaltechnews/ 2023/03/17/how-gpt-4-mastered-the- entire-bar-exam-and-why-that-matters/ abajournal.com/web/article/latest- version-of-chatgpt-aces-the-bar-exam- with-score-in-90th-percentile

https://www.lawnext.com/ 2023/03/gpt-takes-the-bar-exam- again-this-time-it-score-among- top-10-of-test-takers.html

https://www.youtube.com/watch?v=4pGG79VdNmU

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4389233

< THE UBE > UNIFORM BAR EXAM

< THE MBE >

MULTISTATE BAR EXAM (MBE) SUBJECTS TESTED TORTS CONTRACTS EVIDENCE REAL
PROPERTY CIVIL PROCEDURE CONSTITUTIONAL LAW CRIMINAL LAW AND PROCEDURE

< THE MEE >

MULTISTATE ESSAY EXAMINATION (MEE) SUBJECTS TESTED TORTS EVIDENCE CONTRACTS FAMILY
LAW REAL PROPERTY CONFLICT OF LAWS TRUSTS AND ESTATES CONSTITUTIONAL LAW BUSINESS ASSOCIATIONS FEDERAL CIVIL PROCEDURE UNIFORM COMMERCIAL CODE CRIMINAL LAW AND PROCEDURE

MULTISTATE ESSAY EXAMINATION (MEE) https://github.com/mjbommar/gpt4-passes-the-bar/blob/main/data/MEE.md

‘REPRESENTATIVE GOOD ANSWERS’ https://mdcourts.gov/sites/default/ fi les/import/ble/ examanswers/2022/202207uberepgoodanswers.pdf SEVERAL STATE BARS
RELEASE REPRESENTATIVE GOOD ANSWERS THESE ARE VERY HELPFUL FOR EVALUATION PURPOSES AS THEY ARE ACTUAL ANSWERS WHICH ARE ABOVE MERELY PASSING ANSWERS (BUT NOT NECESSARILY PERFECT)

(GPT-3.0 was released in 2020)

(GPT-3.0 was released in 2020) This ain’t passing any bar
exam

< THE MPT >

MULTISTATE PERFORMANCE TEST (MPT) SKILLS TESTED EXAMINEE MUST COMPLETE A
PRACTICAL LAWYERING TASK SUCH AS LEGAL ANALYSIS, FACT ANALYSIS, PROBLEM SOLVING, ORGANIZATION AND MANAGEMENT OF INFORMATION, AND CLIENT COMMUNICATION

MULTISTATE PERFORMANCE EXAM (MPT) 10-15 PAGES OF MATERIALS THE FILE
= THE FACTS THE LIBRARY = THE LAW ~5000 TOKEN INPUTS (ACCESS HERE) BIT.LY/40F3FQ2

OVERALL PERFORMANCE

SOME KEY SHORTCOMINGS OF GPT-4 ON THE BAR EXAM FAILED
TO PROPERLY CALCULATE THE DISTRIBUTION OF ASSETS FROM A TESTAMENTARY TRUST WHICH HAS BEEN DEEMED TO BE INVALID PROVIDED AN INCORRECT ANSWER ON A CIVIL PROCEDURE QUESTION REGARDING DIVERSITY JURISDICTION AFTER THE JOINDER OF A NECESSARY PARTY PROVIDED IMPROPER ANALYSIS ON A REAL PROPERTY (REAL ESTATE) SUBQUESTION REGARDING BOTH THE PROPER DESIGNATION OF A FUTURE INTEREST AND THE APPLICATION OF THE RULE AGAINST PERPETUITIES

https://github.com/mjbommar/gpt4-passes-the-bar ACCESS THE FULL OUTPUT AND OTHER SUPPORTING MATERIALS HERE

OUR BAR EXAM ANALYSIS IS WHAT IS CALLED A ‘ZERO
SHOT’ ANALYSIS

ZERO SHOT ANALYSIS REFLECTS THE FLOOR AND NOT THE CEILING
OF CURRENT CAPABILITIES

ZERO SHOT ENTER PROMPT RECEIVE ANSWER ’PROMPT ENGINEERING’ IS ABOUT
TUNING / REFINING PROMPTS TO OBTAIN BETTER ANSWERS

THIS ZERO SHOT AND NOT EVEN THE LATEST MODEL (I.E.
NOT GPT-4)

*NOT* A VERY SOPHISTICATED TAKE ON THIS SITUATION BUT REFLECTIVE
OF THE MODAL PERSPECTIVE OF LAWYERS / LAW PROFS NOTE: ALL COMMERICAL RESEARCH TOOLS ALREADY HAVE ‘A.I.’ IN THEM

ONE WAY TO DRAMATICALLY REDUCE THE LIKELIHOOD OF A HALLUCINATION
IS TO MOVE OUT OF THE ‘ZERO SHOT’ PARADIGM

AND ANCHOR INITIAL OUTPUT AGAINST SOME ‘GROUND TRUTH’ …

ONE SHOT GET RESULT QUERY THAT RESULT AGAINST SOMETHING ELSE
REFINE RESULT ENTER PROMPT OUTPUT FINAL ANSWER (RETRIEVAL AUGMENTATION) (IF NEEDED) EXAMPLES

THE GENERALIZATION OF ALL OF THIS IS AN ORCHESTRATION LAYER
TO BRING MULTIPLE STREAMS / TECHNOLOGIES TOGETHER

FEW SHOT (CHAIN OF THOUGHT PROMPTING)

HERE DAMIEN RIEHL FROM FASTCASE WILL WALK YOU THROUGH HOW
TO BUILD MORE OF A BRIEF THROUGH SEQUENTIAL PROMPTING … HTTPS://WWW.LINKEDIN.COM/PULSE/CHATGPT- LEGAL-BRIEFWRITING-TOOL-DAMIEN-RIEHL/

HTTPS://WWW.LINKEDIN.COM/PULSE/CHATGPT- LEGAL-BRIEFWRITING-TOOL-DAMIEN-RIEHL/

FEW SHOT (LANGCHAIN / AUTOGPT PROMPTING)

FEW SHOT (LEGAL DOMAIN) (LANGCHAIN / AUTOGPT STYLE ORCHESTRATION LAYER)
https://docs.kelvin.legal/docs/examples/due-dilligence/ https://docs.kelvin.legal/docs/examples/litigation-automation/

THERE ARE LOTS OF OPPORTUNITIES OUTSIDE THE ZERO-SHOT CONTEXT

OR EVEN OTHER PLUGINS … FOR EXAMPLE WOLFRAM COULD HELP
SOLVE FOR ISSUES WITH QUANTITATIVE REASONING

https://arxiv.org/pdf/2303.17651.pdf https://selfre fi ne.info/ https://github.com/madaan/self-re fi ne

GENERATIVE AGENTS

(4) LLMs IN THE DELIVERY OF LEGAL SERVICES

IN GENERAL …

DRAFTING + EDITING COMMUNICATIONS EMAILS REPORTS PRESENTATIONS MARKETING MATERIALS

DRAFTING + EDITING LEGAL DOCUMENTS CONTRACTS BRIEFS MEMOS INTERROGATORIES DEMAND
LETTERS

CONDUCTING LEGAL RESEARCH EXTERNAL POINTS OF LAW INTERNAL KNOWLEDGE MGMT

SUMMARIZING LARGE BODIES OF TEXTUAL MATERIAL SUMMARIZING LEGAL DOCUMENTS

AND REMEMBER WE CAN COMBINE OUTPUTS WITH OTHER MACHINE LEARNING
MODELS, ETC.

OR EVEN OTHER PLUGINS … FOR EXAMPLE WOLFRAM COULD HELP
SOLVE FOR ISSUES WITH QUANTITATIVE REASONING

BUT LETS LOOK AT SEVERAL CONCRETE EXAMPLES …

(1) DRAFT A MNDA

(2) DRAFT A REPLY BRIEF HERE DAMIEN RIEHL FROM FASTCASE
WILL WALK YOU THROUGH HOW TO BUILD MORE OF A BRIEF THROUGH SEQUENTIAL PROMPTING … HTTPS://WWW.LINKEDIN.COM/PULSE/CHATGPT- LEGAL-BRIEFWRITING-TOOL-DAMIEN-RIEHL/

(3) DRAFT REPORT OR PRESENTATION

https://youtu.be/S7xTBa93TX8

DUE DILIGENCE / M&A SUPPORT (4)

https://docs.kelvin.legal/docs/examples/due-dilligence/

https://docs.kelvin.legal/docs/examples/due-dilligence/ DUE DILIGENCE /M&A SUPPORT

https://docs.kelvin.legal/docs/examples/due-dilligence/

LITIGATION SUPPORT & TRIAGE (5)

(6) BUILD A LEGAL KNOWLEDGE GRAPH https://www.ibm.com/topics/knowledge-graph

(6) BUILD A LEGAL KNOWLEDGE GRAPH HTTPS://TAX-GRAPH.273VENTURES.COM/

(6) BUILD A LEGAL KNOWLEDGE GRAPH

(7) LANGUAGE MODELS ARE ZERO-SHOT TAGGERS

https://www.linkedin.com/posts/danielkatz-3b001539_feedbackfriday-legaltech- legaldata-activity-7045070829428113409-fIZz

https://www.law.com/ legaltechnews/2023/03/20/sali- harnesses-most-advanced-gpt- models-to-help-legal-industry- speak-the-same-data-language/ March 23, 2023 Michael Bommarito
- Gentleman Farmer

https://sali-search.kelvin.legal

(8) REGULATORY MONITORING

https://www.linkedin.com/posts/ bommarito_summarize-everything-published-in- the-federal-activity-7048621468422725632-CjuO April 3, 2023

(9) SUBSTANTIVE LEGAL ANALYSIS (COPYRIGHT)

HTTPS://WWW.YOUTUBE.COM/WATCH?V=NQZCRHR8YPU&T=11S

HERE ARE JUST A FEW MORE OF MANY OTHER POTENTIAL
AREAS WHERE THIS CLASS OF TECH MIGHT BE USEFUL … E-DISCOVERY LEGAL BILLING DEALS DATABASES CONTRACT DRAFTING AND MANY MANY OTHER EXAMPLES

HERE A JUST A COUPLE OF RESOURCES THAT HAVE BEEN
MADE AVAILABLE (THERE WILL BE MANY MORE) https://ssrn.com/abstract=4404017

https://thebrainyacts.beehiiv.com/

NOW A QUICK WORD OF CAUTION

BECAUSE OF THE POTENTIAL FOR MODEL HALLUCINATION, ETC.

IT IS IMPORTANT TO USE THESE TOOLS (AT LEAST FOR
NOW) AS PART OF A HUMAN IN THE LOOP PROCESS

IN OTHER WORDS, FOR MOST USE CASES HUMANS SHOULD ALWAYS
BE PART OF THE ‘RETRIEVAL AUGMENTATION’ LAYER

AND OF COURSE OR MACHINES CAN AID IN RETRIEVAL AUGMENTATION
/ QUALITY ASSURANCE

CENTAUR CHESS HUMAN + MACHINE HUMAN OR MACHINE >

(5) STRATEGIC CONSIDERATIONS AND THE ROAD AHEAD

FUD VS FEAR, UNCERTAINTY, & DOUBT FEAR OF MISSING OUT
FOMO

FUD FEAR, UNCERTAINTY, & DOUBT HALLUCINATIONS CONFIDENTIALITY INFORMATION SECURITY

AMAZING CAPABILITIES KEEPING UP WITH THE MARKET NOT WANTING TO
LOOK OUT OF STEP TO CLIENTS FEAR OF MISSING OUT FOMO

FUD VS FEAR, UNCERTAINTY, & DOUBT FEAR OF MISSING OUT
FOMO ORGANIZATIONS / INDIVIDUALS TOGGLE BETWEEN THESE TWO POINTS OF VIEW (SOMETIME WITHIN THE SAME CONVERSATION)

SEVERAL EARLY TOOLS IN THE MARKET …

MAY 4, 2023 https://www.lexisnexis.com/en- us/products/lexis-plus-ai.page

MAY 23, 2023 https://www.lawnext.com/2023/05/ thomson-reuters-previews-its-plans-for- generative-ai-announces-integration-with- microsoft-365-copilot.html

OBVIOUSLY WE HAVE A COMPANY AND WE WORKED WITH CASETEXT
ON THE BAR PAPER — SO PERHAPS WE ARE NOT 100% NEUTRAL … SHANG GAO PABLO ARREDONDO

BUT OF COURSE THESE WILL NOT BE THE LAST TOOLS
AND IT REMAINS TO BE SEEN HOW IT WILL ALL SHAKE OUT …

I THINK IT IS CLEAR THAT THIS IS GOING TO
BE A LONG RACE …

WHAT IS THE DATA AND TECHNOLOGY STRATEGY THAT ORGANIZATIONS CAN
EMPLOY IN LIGHT OF THESE CHANGE IN THE TECHNOLOGY LANDSCAPE ?

BUILD VS ASSEMBLE VS BUY BUILD IS LIKELY OFF THE
TABLE FOR THE SHORT TO MEDIUM TERM ASSEMBLE HOWEVER IS A VIABLE OPTION SO CAREFUL PROCUREMENT IS GOING TO BE THE STRATEGIC PATH

DATA STRATEGY HOW TO COLLECT / REGULARIZE DATA FOR USE
INSIDE THESE SYSTEMS OR AS A LAYER ON TOP OF THESE SYSTEMS

SEVERAL OTHER STRATEGIC CONSIDERATIONS WHAT IS THE ROLE OF DOMAIN
SPECIFIC TRAINING? HOW COULD I CUSTOMIZE THESE MODELS FOR USE WITHIN MY OWN ORGANIZATION ? WHICH MODELS / LLMS DO I LEVERAGE ? HOW DO I CHOOSE ? CAN I MIX AND MATCH ? WHAT IS THE DIFFERENTIAL IMPACT OF THESE MODELS BY LEGAL ORGANIZATION ? HOW DO I THINK ABOUT QUESTIONS OF PRIVACY AND INFORMATION SECURITY ? COPYRIGHT?

WHAT IS THE DIFFERENTIAL IMPACT OF THESE MODELS BY LEGAL
ORGANIZATION ? (1)

I THINK THAT THERE ARE GOING TO BE DIFFERENTIAL IMPACTS
BY TYPE OF LEGAL ORGANIZATION

MANAGERS SHOULD REORGANIZE JOBS SO ORGANIZATION CAN FURTHER CONCENTRATE TASKS
WHICH CAN BE ENABLED BY A.I. MICRO LEVEL

LOOK TO PLACES WHERE THERE IS A CONCENTRATION OF LOW
TO MEDIUM COMPLEXITY TASKS MACRO LEVEL ALSP, LPO, LEGAL OPS, SPECIALIZE LAW FIRMS, ETC.

TRAINING FOLKS TO USE THESE TOOLS TO THE MAXIMUM EXTENT
POSSIBLE HUMAN CAPITAL (THIS WILL BE AN IMPORANT LIMITATION ON ORGANIZATIONAL SUCCESS)

HOW SHOULD I THINK ABOUT QUESTIONS OF PRIVACY AND INFORMATION
SECURITY ? COPYRIGHT? (2)

SHOULD / CAN I PUT CONFIDENTIAL CLIENT DATA IN THESE
SYSTEMS ? MANY FOLKS HAVE ASKED ME —

PROCEED WITH CAUTION — I WOULD TELL YOU TO AUDIT
PRECISELY WHAT IS HAPPENING AND WHERE IT IS HAPPENING SHOULD / CAN I PUT CONFIDENTIAL CLIENT DATA IN THESE SYSTEMS ? (CLIENT CONSENT + AUDITED SAFEGUARDS) MANY FOLKS HAVE ASKED ME —

THE ROGUE ASSOCIATE (OR PARTNER) PASTING STUFF INTO GPT OR
ANOTHER LLM MODEL ONE VERSION OF THE CONCERN

https://mashable.com/article/samsung-chatgpt-leak-details

WE HAVE BEEN WORKING WITH A FEW FIRMS ON HOW
TO NAVIGATE THE THORNY INFO SEC AND LEGAL ETHICS ISSUES

IF NOT, DOES VENDOR HAVE SOC2 / ISO2700 ? HOW
MANY OTHER PARTIES ARE IN THE FLOW OF YOUR INFORMATION ? CONTRACTUAL REPRESENTATIONS FROM THOSE 3RD PARTIES? IS THE SOLUTION AVAILABLE ON PREM ? SOME VENDOR QUESTIONS WHAT CONTROLS DOES THE VENDOR APPLY TO THE TRANSITING OF YOUR DATA ?

LEVERAGING THESE TOOLS ON INTERNAL DATA IS REALLY THE HOLY
GRAIL …. INTERNAL DATA WE ARE GOING TO GET THERE BUT IT REQUIRES A REAL THOUGHT OUT APPROACH HERE

WHAT IS GOING TO HAPPEN WITH COPYRIGHT ? MANY FOLKS
HAVE ASKED ME —

WHAT IS GOING TO HAPPEN WITH COPYRIGHT ? I THINK
THIS IS GOING TO LEAD TO A MAJOR DECISION IN COPYRIGHT AND/OR ACTION BY CONGRESS, ETC. MANY FOLKS HAVE ASKED ME —

https://arxiv.org/pdf/2303.15715.pdf THIS IS A VERY GOOD PAPER ON THE TOPIC

WHAT IS THE ROLE OF DOMAIN SPECIFIC TRAINING? (3)

WILL A GENERAL MODEL BEAT A DOMAIN SPECIFIC MODEL ?
SURE THAT IS POSSIBLE / LIKELY — IF THE GENERAL MODEL IS LARGE AND DOMAIN MODEL IS SMALL

AGAIN HERE IS AN EXAMPLE WITH ACTUAL RESULTS ATTACHED TO
IT …

https://www.bloomberg.com/company/press/ bloomberggpt-50-billion-parameter-llm-tuned- fi nance/ https://arxiv.org/pdf/2303.17564.pdf

https://twitter.com/rasbt/status/1642880757566676992

SO HOW COULD THIS BE IMPROVED EVEN FURTHER ?

SOURCES OF LLM MODEL IMPROVEMENT USE DIFFERENT TRAINING DATA NEURAL
NET ACCESS / IMPLEMENTATION INSTRUCTION MODULE FINE TUNING RETRIEVAL AUGMENTATION (RAG) PROMPT ENGINEERING CHAIN OF THOUGHT PROMPTING RLHF AGENT KNOWLEDGE GRAPH TRAVERSAL MODEL CREATOR MODEL USER (REINFORCEMENT LEARNING FROM HUMAN FEEDBACK)

SO WILL THERE BE A ‘LAW GPT’? PROBABLY SOON IT
IS AN OPEN QUESTION WILL IT BE BETTER THAN GPT-4 ON LAW TASKS?

HOW COULD I CUSTOMIZE THESE MODELS FOR USE WITHIN MY
OWN ORGANIZATION ? (4)

HOW IS ALL OF YOUR DATA GOING TO GET INSIDE
OF THESE SYSTEMS … ?

WE ARE LIKELY ON A PATH TO INTERNAL GPT STYLE
OFFERINGS

FOLKS ARE EVENTUALLY GOING BUILD / TRAIN / TUNE THEIR
OWN GPT STYLE MODELS…

TO DO SO FOLKS ARE GOING TO NEED TO STRUCTURE
/ PREPROCESS THEIR DATA

https://nationalmagazine.ca/en-ca/articles/legal-market/legal-tech/2023/chatting-with-gpt

CONNECTING THE THREE LAYERS https://nationalmagazine.ca/en-ca/articles/ legal-market/legal-tech/2023/chatting-with-gpt

WHICH MODELS / LLMS DO I LEVERAGE ? HOW DO
I CHOOSE ? CAN I MIX AND MATCH ? (5)

SO WE HAVE SEEN QUITE A BIT OF THIS SINCE
THE LAUNCH OF CHATGPT NOW

THIS IS NOT INHERENTLY BAD BUT I THINK ORGANIZATIONS NEED
TO THINK ABOUT THEIR PRECISE STRATEGY HERE NOW

SOURCES OF LLM MODEL IMPROVEMENT USE DIFFERENT TRAINING DATA NEURAL
NET ACCESS / IMPLEMENTATION (ALPACA, ETC.) INSTRUCTION MODULE FINE TUNING RETRIEVAL AUGMENTATION (RAG) PROMPT ENGINEERING CHAIN OF THOUGHT PROMPTING (LANGCHAIN, ETC.) RLHF (E.G. BLOOMBERG GPT) (DOLLY, ETC.) (PLUGINS / UI / GROUNDING) MODEL CREATOR MODEL USER (VARIOUS FORMS) (VARIOUS FORMS) (REINFORCEMENT LEARNING FROM HUMAN FEEDBACK) (AGENTS BUILD / TRAVERSE GRAPHS) (MANY APPROACHES) AGENT KNOWLEDGE GRAPH TRAVERSAL

REMEMBER YOU ARE GOING TO HAVE DIRECT ACCESS …

SO WHAT IS THE VENDOR VALUE ADD OVER BASE LLM
MODEL? TRUST BUT VERIFY THERE IS GOING TO BE SIGNIFICANT PRESSURE ON VENDORS TO OVERSTATE THE ACTUAL CONTRIBUTION OF THEIR OFFERING ABOVE JUST AN LLM API CALL I SUGGEST YOU TRUST BUT VERIFY ALL CLAIMS

CAN YOU DETERMINE WHETHER A VENDOR IS SIMPLY SELLING YOU
A UI/ UX WRAPPER ON TOP OF AN LLM ? AGAIN THIS MIGHT BE OKAY BUT DO NOT PAY AN EXCESSIVE PREMIUM …

IT WOULD BE A BIG MISTAKE TO GO ALL IN
ON ANY VENDOR OR SPECIFIC LLM AT THIS POINT PLACE A SMALL TO MEDIUM BET

AS THE YEAR PROGRESSES, I BELIEVE THIS WILL *NOT* JUST
BE A GPT STORY …

IT IS A HIGHLY COMPETITVE LANDSCAPE AND OTHER FOLKS WILL
BE ENTERING THE MARKET WITH ADDITIONAL OFFERINGS

THERE ARE OTHER PLAYERS BESIDES OPENAI AND THEY WILL LIKELY
PURSUE OTHER STEPS / MOVING PARTS … AND MANY MORE …

REMEMBER THAT GOOGLE ACTUALLY INVENTED MUCH OF THE TECH THAT
BROUGHT YOU GPT https://www.forbes.com/sites/richardnieva/ 2023/02/08/google-openai-chatgpt-microsoft- bing-ai/ https://www.nytimes.com/2023/01/20/ technology/google-chatgpt-arti fi cial- intelligence.html

CAN YOU BOTH RAPIDLY AND RIGOROUSLY EVALUATE THE QUALITY OF
MODELS OR FIGURE OUT HOW TO MIX AND MATCH THEM … ? (ENSEMBLE LEARNING ANYONE?)

FINAL THOUGHTS

THIS IS SOMETHING OF A DIFFERENT FLAVOR FROM THE AVERAGE
TECHNOLOGICAL INNOVATION …

NOTE THIS IS A CHATGPT PAPER NOT EVEN CONSIDERING POTENTIAL
ADDITIONAL GAINS IN GPT-4 https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4375283 “TIME TAKEN DECREASES BY 0.8 SDS AND OUTPUT QUALITY RISES BY 0.4 SDS.”

OVER 50% PRODUCTIVITY GAINS FROM GPT-3.5 VERSION OF COPILOT (USED
FOR PROGRAMMING) https://arxiv.org/pdf/2302.06590 COPILOT X RELEASED MARCH 23RD 2023 https://github.blog/2023-03-22-github-copilot- x-the-ai-powered-developer-experience/ FEBRUARY 13 2023

https://arxiv.org/abs/2303.10130 “OUR FINDINGS REVEAL THAT AROUND 80% OF THE U.S.
WORKFORCE COULD HAVE AT LEAST 10% OF THEIR WORK TASKS AFFECTED BY THE INTRODUCTION OF LLMS, WHILE APPROXIMATELY 19% OF WORKERS MAY SEE AT LEAST 50% OF THEIR TASKS IMPACTED. WE DO NOT MAKE PREDICTIONS ABOUT THE DEVELOPMENT OR ADOPTION TIMELINE OF SUCH LLMS”

TASKS VS JOBS WHAT IS BEING MADE POSSIBLE? WE RACE
WITH THE MACHINE LABOR MARKET IMPLICATIONS (IT IS COMPLICATED) (IN A WORLD WHERE TEXT GENERATION IS FAR CHEAPER)

OVERALL, THERE SEEMS TO BE NON-LINEAR PERFORMANCE PERHAPS AKIN TO
BROADER LANGUAGE ACQUISTION ?

IS THERE IS SOMETHING MORE FUNDAMENTAL GOING ON EMERGENT BEHAVIOR
?

CUT+PASTE SAFETY FIRST THIS IS ALL KINDA BACK TO THE
FUTURE FOR ME

https://research.google/pubs/pub52065/

https://futurism.com/gpt-4-sparks-of-agi https://www.youtube.com/watch?v=qbIk7-JPB2c

THIS IS AN ACTIVE DEBATE IN THE ACADEMIC LITERATURE I
WOULD SAY THE JURY IS STILL OUT

AND WHILE THERE ARE LIMITS AND THINGS DO NOT GROW
EXPONENTIALLY FOREVER

I THINK THIS IS GOING TO BE THE MOST EXCITING
YEAR IN TECHNOLOGY IN A VERY LONG TIME !

273VENTURES.COM KELVIN.LEGAL

https://www.linkedin.com/in/daniel-katz-3b001539/

@COMPUTATIONAL

G E N E R AT I V E A
. I . + L AW @ computational professor daniel martin katz danielmartinkatz.com Illinois tech - chicago kent law 273Ventures.com B AC KG R O U N D, A P P L I CAT I O N S A N D U S E CA S E S I N C LU D I N G G P T- 4 PA S S E S T H E B A R E X A M https://bit.ly/3yxhY2e

Generative A.I. + Law - Background, Application...

Generative A.I. + Law - Background, Applications and Use Cases Including GPT-4 Passes the Bar Exam

More Decks by Daniel Martin Katz

Other Decks in Research

Featured

Transcript